R´ esolution de PJD : actualisation n´ egative (downdating)

4.2 Suivi avec occultations

4.2.3.6 R´ esolution de PJD : actualisation n´ egative (downdating)

La décomposition de Cholesky G0 = R0>R0 peut être précalculée pendant la phase d’apprentissage. La matrice H s’obtient en supprimant des lignes et des colonnes à G0.

Principe. Les opérations d’actualisation servent à mettre à jour la décomposition d’une matrice quand des lignes ou des colonnes lui sont ajoutées (actualisation positive, up- dating) ou retirées (actualisation négative, downdating).

Approches classiques. ˚Ake Björck ([Bjö96] § 3.2) étudie l’actualisation des décom- positions QR et de Cholesky, qui sont liées : si A = QR alors A>A = R>R. Il distingue les cas faciles (ajout d’une ligne et suppression d’une colonne de A) des cas difficiles (ajout d’une colonne et suppression d’une ligne).

Dans les problèmes de moindres carrés linéaires, le retrait d’une expérience nécessite de supprimer une ligne. Les résolutions OLS et TLS sont traitées séparément :

– cas OLS : il s’agit alors du downdating d’une décomposition QR. La routine dchdd [Sau72] de linpack concrétise des études vieilles de plus de 30 ans, et les recherches récentes portent sur les approches par blocs [EP94a] et leur stabilité [EP94b] ; 2_{Nous comptons une op´}_{eration flottante (flop) par addition/soustraction et une par multiplication. Les}

divisions et les extractions de racines carrées, quoique plus coûteuses, sont en nombre négligeable par rapport aux opérations simples. Nous indiquons seulement le terme dominant du nombre d’opérations flottantes. Nous faisons abstraction des accès mémoire.

– cas TLS : l’actualisation concerne une décomposition SVD. Celle-ci étant coûteuse [PH95], l’intérêt s’est reporté sur les d´_{ecompositions URV et ULV « révélatrices de} rang ». Jesse Barlow traite leur actualisation dans [BYZ96] et [BY97]. Selon lui, l’actualisation par blocs dans ce cas TLS est un sujet de recherche vierge. La bi- blioth`_{eque Matlab UTV Tools, consacrée à ces factorisations, propose des rou-} tines de up(down)dating ([FHH90] § 4).

Tous les algorithmes d’actualisation ont au mieux une complexit´e moyenne en O(n2_{) pour}

la suppression d’une seule ligne/colonne.

Dans notre cas. Selon la classification de Bj¨orck, notre cas est favorable : il consiste `

a actualiser une décomposition de Cholesky en supprimant plusieurs colonnes de A = G>. En général ces colonnes ne sont pas consécutives. En conséquence, le traitement d’un bloc est exceptionnel : nous ne présentons ici que le cas du retrait d’une colonne.

Si T ∈ Rn×n _{est une matrice orthogonale, on peut ´}_{ecrire :}

H = ΩG0Ω> R>R = ΩR0>R0Ω>

= ΩR0>T>T R0Ω> = (T R0Ω>)>T R0Ω>

Nous choisissons T de manière à rendre S = T R0Ω> triangulaire supérieure, ce qui peut se faire par une séquence de rotations de Givens. Par unicité de la décomposition de Cholesky, R est alors le triangle supérieur de S.

Implémentation. Nous ne manipulons pas T explicitement, nous appliquons seulement les rotations de Givens à S ([GL91] eq 5.1.8 et 5.1.9). Pour des raisons d’efficacité, pendant l’opération, nous représentons la matrice à traiter sous la forme d’un produit D−1/2S, où D = diag(d) ∈ Rn×n est modifiée en même temps que S (algorithme 4.2).

Complexité. La complexité de l’algorithme d’actualisation dépend de la répartition des points occultés : C = 2n02+ 4 n0 X i=1 (pi− i)(n0 − i)

Voici quelques cas de figure de r´epartitions :

– cas meilleur : tous les points occult´es sont `a la fin de la liste (pi = i) :

C = 2n02

– cas pire : tous les points occult´es sont au d´ebut de la liste (pi = i + n − n0) :

4.2. SUIVI AVEC OCCULTATIONS 123

S ← R0Ω> -- S est R0 priv´e des colonnes occult´ees

d ← [1 · · · 1]> _{∈ R}n _{-- D = Id}

Pour i de 1 `a n0 faire

Pour k de i + 1 `a pi faire

fast_givens(di, Si,i:n0, d_k, S_k,i:n0) -- coˆut : 4(n0− i) flops

finpour -- 4(pi− i)(n0− i) flops

finpour -- le triangle sup´erieur de D−1/2S = R

S0 ← S1:n0_,1:n0

D0 ← diag(d1:n0) -- ainsi, H = R>R = S0>D0−1S0

r´esoudre S0>x0 = y en x0 -- n02 flops

r´esoudre S0x = Dx0 en x -- n02+ n0 flops

La d´ecomposition r´esultante est diag(d)−1/2S.

Fonction utilis´ee : la fonction fast_givens(d1, l1, d2, l2) effectue une rotation (ou une

r´eflexion) entre les lignes d−1/2₁ l1 et d −1/2

2 l2, de mani`ere `a annuler l21. En convenant que

toutes les variables sont en entr´ee et en sortie, ceci s’´ecrit :

(x1, x2) ← (l11, l21) -- les éléments qui déterminent des facteurs de rotation

Si x2 6= 0 alors -- sinon, rien `a faire

Si x2₁d2 ≤ x22d1 alors -- la deuxi`eme ligne est « dominante »

l1 l2 ← d2x1 d1x2 1 1 −x1 x2 l1 l2 -- r´eflexion (d1, d2) ← (1 + d2x21 d1x22)(d2, d1)

sinon -- la premi`_{ere ligne est « dominante »}

l1 l2 ← 1 d1x2 d2x1 −x2 x1 1 l1 l2 -- rotation (d1, d2) ← (1 + d1x22 d2x21)(d1, d2) finsi finsi

Algorithme 4.2: Résolution de ΩG0Ω>x = y en x par actualisation négative (downdating) de la décomposition de Cholesky R0 de G0.

– cas moyen : les points occultés sont répartis régulièrement (pi = bin/n0c) : C = 4 n0 X i=1 in n0 − i (n0− i) + 2n02≈ 4 n0 X i=1 in n0 − i (n0 − i) ≈ 2 3(n − n 0 )(n0+ 1)(n0+ 2) + 2n02

Si le rapport α = n0/n est constant, l’algorithme a une complexité en O(n3). Cependant, le coefficient du n3 est faible : 2₃(1 − α)α2, ce qui suggère que, pour les valeurs de n considérées, il peut être intéressant. Si nous considérons le cas moyen avec les chiffres mentionnés, C ≈ 6 Mflop.

4.2.3.7 R´esolution de PJD : approche it´erative

Le modèle à l’origine de l’équation ΩG0Ω>x = y est une approximation (celle de la phase d’apprentissage de JD), ce qui implique que nous pouvons nous contenter d’une approximation de la solution en x (une erreur relative de ±0.1% sur les éléments du vecteur est acceptable). Ceci suggère d’utiliser une résolution itérative.

Méthodes itératives classiques. Nous avons appliqué les méthodes itératives de Jaco- bi/Gauss-Seidel et du gradient conjugué ([GL91] eq10.1.3 et alg10.2.1). Comme la matrice H = ΩG0Ω> du système est pleine, le coût de ces algorithmes est déterminé par celui d’un produit matrice-vecteur avec H (il y a un produit par itération qui coûte 2n02 flops).

Dans notre cas, ces méthodes nécessitent de l’ordre de 60 itérations pour converger vers des valeurs utilisables, ce qui correspond à 10.8 Mflops. Ce n’est pas compétitif ; nous devons exploiter les particularités du problème.

Amélioration. Typiquement, on résout un problème linéaire de matrice A à l’aide d’une méthode itérative dans les cas suivants :

– la matrice A est creuse et sa décomposition la rendrait pleine. Comme une solution itérative repose sur des produits avec A, on peut exploiter le caractère creux ; – on dispose d’une bonne approximation de la solution et quelques itérations permet-

tront de converger ;

– on dispose d’une bonne approximation de A−1. C’est le cas le plus favorable. Nous faisons « comme si » nous ´etions dans ce troisi`eme cas car :

– nous pouvons calculer G0−1;

– nous postulons que M−1 = ΩG0−1Ω> est une approximation utilisable de (ΩG0Ω>)−1. Nous l’utilisons dans un « pr´econditionneur » pour un algorithme de gradient conjugu´e ♠

([GL91] algo10.3.1). L’algorithme 4.3 d´ecoule de toutes ces consid´erations.

L’algorithme converge à la précision machine en 15 itérations environ (une itération coûte 4n02 flops). Nous disposons d’un résultat suffisamment précis en 5 itérations, c’est- `

4.2. SUIVI AVEC OCCULTATIONS 125 k ← 0 ; x ← 0n0; r ← y

Tant que r 6= 0n0 et k < k_max faire

z ← ΩG0−1Ω> -- application du pr´econditionneur (2n0 flops)

Si k = 0 alors -- calcul de la direction du prochain pas

u ← kzk2 p ← z sinon u ← r>z p ← z + _uu precp finsi a ← ΩG0Ω>p -- 2n0 flops α ← _p>u_a

x ← x + αp -- mise-`a-jour de l’estimation

r ← r − αa -- mise-`a-jour des r´esidus

k ← k + 1 ; uprec ← u

fintantque

Algorithme 4.3: Résolution de ΩG0Ω>x = y en x par une méthode itérative (kmax

itérations) de gradient conjugué préconditionné. L’inverse de G0 est précalculée.

Dans le document Estimation d'homographies inter-images : cas des mosaïques et du suivi en temps réel : applications en réalité augmentée (Page 123-127)