Exercice maison : utiliser les idées du programme précédent pour calculer le déterminant

(1)

PSI *

Année 2021-2022

PSI*

Exercice maison : utiliser les idées du programme précédent pour calculer le déterminant d’un matrice carrée. Complexité exigée cubique ! !

Solution disponible :

'

&

$

%

def det(A):

det=1

Ac = copy(A) n = len(A)

for i in range(n-1):#indice de colonne j = chercher_pivotN(Ac, i)

if j!=i:

det=-1*det

echange_lignesNN(Ac, i, j)

for k in range(i+1, n):#ne changent pas le det car on remplace une...

mu = Ac[k][i]/float(Ac[i][i])

transvection_ligneNN(Ac, k, i, -mu)#lk<---Lk-mu*Li for s in range(n):# triangulaire

det = det*Ac[s][s]

Exercice de cours : Décomposition Q-R

Relire le cours à ce sujet est une bonne idée pour mieux comprendre.

Voilà les éléments de cours (maths) à ce sujet :

Algorithme d’orthonormalisation de Gram-Schmidt

1

(2)

Def : Soit E un espace préhilbertien réel.

Soit (e_i)_16i6p une famille libre de E.

Pour tout i de{1, . . . , p}, on pose ε_i = 1

kuiku_i, où u_i =e_i−

i−1

X

j=1

(ε_j |e_i)ε_j

La première étape de l’algorithme consiste bien sûr à poser ε₁ = 1 ke1ke₁

Prop : Avec les notations précédentes, l’algorithme de Gram-Schmidt se termine.

Pour tout i de{1, . . . , p}, on a Vect {ε₁, . . . , ε_i}

= Vect {e₁, . . . , e_i}

, et (ε_i |e_i)>0.

La famille (ε_i)_16i6p ainsi construite est une base orthonormale deVect {e₁, . . . , e_p} . Mais aussi :

Prop : (Décomposition Q-R).

Soit A∈Gl_n(R), alors il existe un unique couple Q, R où Q∈O_n(R) etR ∈T_n⁺⁺(R).

Preuve : Unicité ( si... ) A=Q1R1 =Q2R2 alors Q⁻¹₂ Q1 =R2R⁻¹₁ ∈ On(R).

Donc, on a un produit de triangulaires supérieures et orthogonales, cf exo avant c’est une symétrie, mais les éléments diagonaux sont strictement positifs.

Bref c’estI_n. R₁ =R₂.

Existence : A étant inversible, les colonnes forment une base :(c_i)ⁿ₁. A=M at(Id,(c_i)ⁿ₁,(e_i)ⁿ₁) avec(e_i)ⁿ₁ base canonique et orthonormale.

On fait un schéma en cascade : , on compose deux identités , base de départ (c_i)ⁿ₁, base du milieu (u_i)ⁿ₁, base finale(e_i)ⁿ₁. Avec la base (u_i)ⁿ₁ obtenue par G-S à partir de c_i)ⁿ₁.

AlorsP((e_i)ⁿ₁,(u_i)ⁿ₁) est orthogonale car bon vers bon.

(3)

Et P((u_i)ⁿ₁,(c_i)ⁿ₁) est triangulaire supérieure

avec une diagonale de termes strictement positifs. (Voir G-S)...

Le code python Q-R.py

'

&

$

%

import numpy as np

np.set_printoptions(precision = 5) #pour un affichage raisonnable from math import sqrt

def ps(u, v):#bon...

n = len(u) s = 0

for k in range(n):

s += u[k]*v[k]

return s def norme(u):

return sqrt(ps(u, u))

def QR(A): #A est une matrice carrée inversible n = len(A)

e = np.transpose(A);(sss) R = np.zeros((n, n)) orth = np.zeros((n, n))

for j in range(n):#le i du cours

v = e[j]# les vecteurs colonnes de A

for k in range(j):#attention aux indices 0 R[k, j] = ps(orth[k], e[j])

v = v - R[k, j]*orth[k] # vous avez reconnu ? R[j, j] = norme(v)

orth[j] = v/R[j, j]# on remplit au fur et à mesure...

return np.transpose(orth), R# et oui, orth[j]est une ligne, on veut en colonne(sss) L = [[1, 2, 3], [4, 5, 6], [8, 9, 7]]

A = np.array(L) Q, R = QR(A)

Bien sûr, vous aurez vu que la matrice R triangulaire supérieure est la matrice de G-S.

Q∈ O_n(R) et est la matrice de passage de la base C à l’orthonormalisée de Schmidt.

Les vecteurs colonnes sont donc ...

Calcul du poly caractéristique d’une matrice par la méthode de Le Verrier

(4)

La méthode originale (Le Verrier, 1840)

Soit A∈ M_n(C), et (λ₁, ..., λ_n) ses valeurs propres dans C (distinctes ou non).

On sait que le polynôme caractéristique de A s’écrit :

χ

_A=Xⁿ−σ1Xⁿ⁻¹+σ2Xⁿ⁻²− · · ·+ (−1)ⁿ⁻¹σn−1X+ (−1)ⁿσn,

où les σ_i sont les fonctions symétriques élémentaires des racines.

De plus, en trigonalisantA, on montre facilement que :∀k ∈N, tr(A^k) =

n

X

i=1

λ^k_i

Notons alors s_k =

n

X

i=1

λ^k_i. On a :

(1) s₁ =σ₁ (2) s₂ =

n

X

i=1

λ²_i =

n

X

i=1

λ_i

!2

−2X

i<j

λ_iλ_j =σ₁²−2σ₂.

(3) Cela se complique ensuite, mais l’on peut montrer les formules suivantes (de New- ton) :

∀k6n, s_k−σ₁s_k−1+· · ·+ (−1)^k−1σ_k−1s₁+ (−1)^kkσ_k= 0.

Ces formules permettent donc de calculer par récurrence les σi connaissant les sk, donc de calculer les coefficients du polynôme caractéristique deA connaissant les tr(A^k).

1er programme

(1) Quelle est la complexité de cet algorithme pour calculer

χ

_A? (2) Écrire le programme Python correspondant, en utilisantnumpy.

Solution :

Le nombre d’opérations élémentaires pour calculer un produit matriciel à l’aide des formules vues en cours :

(5)

c_i,k =

n

X

j=1

a_i,jb_j,k

est de n²(2n−1) (n² termes, et à chaque fois n multiplications et n−1additions).

Dans l’algorithme de Le Verrier, il faut calculer A², A³, . . . , Aⁿ⁻¹ puis seulement les termes diagonaux de Aⁿ, ce qui va donner

(n−2)n²(2n−1) +n(2n−1) opérations arithmétiques.

Ensuite il faut calculer les traces de n matrices, soit n(n−1) additions.

Enfin, la résolution de la récurrence exige 2

n

X

k=1

(k−1) =n(n−1)opérations.

En conclusion, la complexité de l’algorithme est en O(n⁴).

Rq : testez ce programme avec une matrice compagnon.

Ca marche bien et c’est très visuel.

import numpy as np def leverrier(A):

n = A.shape[0]

Ak = A.copy() # puissances de A s = [] # liste des sk

P = [1] # coeff dominant for k in range(1,n+1):

s.append(np.trace(Ak)) Ak = np.dot(Ak, A) somme = 0

for i in range(len(P)):

somme -= P[i]*s[-1-i]

P.append(somme/k) return P

Une amélioration : l’algorithme de Faddeev-Souriau (1948)

(6)

Thm : Soit A∈ M_n(K); on pose A₁ =A puis :

∀k ∈J2, nK, A_k =A

A_k−1− 1

k−1tr(A_k−1)I_n

. Alors :

χ

_A^{(X) =}^Xⁿ⁻

n

X

k=1

1

ktr(A_k)X^n−k Preuve : On démontre par récurrence sur k∈J1, nK que

A_k =A^k−σ₁A^k−1+· · ·+ (−1)^k−1σ_k−1A et tr(A_k) = (−1)^kkσ_k en utilisant les formules de Newton données ci-dessus.

2ème programme

(1) Quelle est la complexité de cet algorithme pour calculer

χ

_A^?

(2) Écrire le programme Python correspondant, en utilisantnumpy.

Comparer avec le programme précédent.

def souriau(A):

n = A.shape[0]

Ak = A.copy() # puissances de A I = np.identity(n)

P = [1] # coeff dominant for k in range(1,n+1):

c = -np.trace(Ak)/k P.append(c)

Ak = np.dot(A, Ak + c*I ) return P

Exemple de programme adapté à un objet spécifique.

Résolution d’un système tridiagonale : Le problème se pose classiquement par :

Algorithme de Thomas (1949) pour la résolution d’un système tridiagonal :

(7)

Soit à résoudre un systèmeM X =D écrit sous la forme







b₁ c₁ 0 0

a₂ b₂ c₂ 0 0 0 a₃ b₃ c₃

. ..

. .. bn−1 cn−1

0 a_n b_n











 x₁ x₂ x₃ ... xn−1

x_n







=





 d₁ d₂ d₃ ... dn−1

d_n







Dans une première phase, on rend le système triangulaire supérieur : pour k variant de 2 à n faire

m = a_k b_k−1 b_k =b_k−mck−1

d_k=d_k−mdk−1

puis on résout le système obtenu en commençant par la dernière équation : x_n= d_n

bn

pour k variant de n-1 à 1 faire x_k = d_k−c_kx_k+1

b_k

Evaluer la complexité de cet algorithme et comparer à l’algorithme naif.

Merci Odin ! Complexité linéaire ( c’est mieux !).

Conseil personnel , écrire ce programme ( qui marche ! !) sans le cours.

Les décalages d’indices sont omniprésents...

Puis testez sur une matrice de votre choix, comparer le résultat avec pivot de gauss ( vu avant dans ce cours d’informatique ).

(8)

'

&

$

%

def TriDiag(a, b, c, d):

n = len(b)

for k in range(0,n-1):

m = a[k] / b[k]

b[k+1] = b[k+1] - m * c[k]

d[k+1] = d[k+1] - m * d[k]

x = n * [0]

x[n-1] = d[n-1] / b[n-1]

for k in range(n-2, -1, -1):

x[k] = (d[k] - c[k] * x[k+1])/b[k]

return(x)

Autre exemple la décomposition LU

Pour toute matrice A possédant des propriétés requises... Au tableau.

Par exemple tous les éléments de la diagonale non nuls (CS). Sinon on inverse des lignes...

Il existe une unique décompositionA =LU avecL de type "Lower" et U de type "Up- per".

La diagonale de L étant composée de1, "preuve" au tableau...Coeff par coeff...

Nous avons dans ce cours, deux façons de voir le problème :

• On devine l’algorithme et après on le programme.

• Je vous donne le programme et on explique l’algorithme, car on manque de temps...

(9)

'

&

$

%

import numpy as np from copy import copy

def transvectionbis(A,i,j,coef,jj):

for k in range (jj,len(A)):

A[i,k]+=coef*A[j,k]

def transvectioncolbis(A,i,j,coef,jj):

for k in range(jj,len(A)):

A[k,i]+=coef*A[k,j]

def LU(A):

n=len(A) U=np.copy(A) L=np.identity(n) for j in range(n):

for k in range(j+1,n):

coef=-1*U[k,j]/U[j,j]

transvectionbis(U,k,j,coef,j)

transvectioncolbis(L,j,k,-1*coef,0) return (L,U)

Première partie de notre travail : comprendre les sous programmes.

Bis : L_i <−L_i+coef ∗L_j mais après Cjj...

Colbis :C_i <−C_i+coef ∗C_j mais après Ljj...

Difficile à vectoriser.

Puis le programme final, on fait apparaitre des 0sur la première colonne de U (ligne par ligne) mais en maintenant le produit LU constant ègal àA,

puis la deuxième colonne...etc

Remarque j est un indice de colonne etk de ligne.

Les questions importantes :

Correction : l’invariant de boucle peut être à chaque tour de boucle :

Le produit des variables locales L etU est égal à A (initialisation et sortie).

Mais aussi ( c’est le problème de tout mettre dans l’invariant ), typiquement

(10)

au concours on vous demanderait de le citer correctement mais pas de le prouver.

La matrice L reste triangulaire inférieure à diagonale de 1.

Et la matriceU possède des 0sur les colonnes déjà traitées, ainsi que le morceau de colonne en cours de traitement.

La complexité : attention à d’abord évaluer celle des sous programmes...

Bien sûr, elle est vérifiable avec "time".

Elle est cubique, car ...Les sous-programmes sont de complexité linéaire en moyenne.

Puis deux boucles imbriquées, avec un coeur de boucle à coût linéaire ( en moyenne).

n−1

X

j=0 n−1

X

k=j+1

2 +

n−1

X

j

3 +

n−1

X

0

3

! .

L’utilité : si on doit résoudre plusieurs systèmes de même matrice,

mais avec des seconds membres qui changent, alors la mettre sous ce format nous ramène à des résolutions de systèmes triangulaires ( voir remontée ).

Recherche des éléments propres

Il est souvent nécessaire de savoir calculer numériquement les valeurs et les vecteurs propres dans des situations concrètes impliquant des grands systèmes où les méthodes théoriques sont pratiquement inutilisables.

La stratégie générale pour déterminer les valeurs propres et les vecteurs propres consiste à construire une suite de transformations en des matrices semblables jusqu’à l’obtention d’une matrice diagonale, ou plus simplement jusqu’à l’obtention d’une matrice triangulaire, à partir de laquelle il est possible de déterminer assez facilement les vecteurs propres.

Pour réaliser ces transformations, deux grandes classes de méthodes sont disponibles : les méthodes directes et les méthodes itératives.

Les premières consistent à effectuer une suite de transformations conservant la simili- tude ; elles ne s’appliquent que sur des matrices de taille modeste, car le temps de calcul

(11)

croît comme le cube de la taille de la matrice.

Pour les matrices de grande taille et généralement creuses, les méthodes itératives sont plus adaptées.

De plus, il existe des méthodes spécifiques pour certaines catégories de matrices (les matrices symétriques, tridiagonales etc...).

Méthode de la puissance itérée

Ceci donne une très bonne approximation de la plus grande valeur propre en module.

La suite est disponible pour élèves très motivés, elle est très crescendo...

Informatique, evn , fonctions de plusieurs variables ...