• Aucun résultat trouvé

Pyramide laplacienne .1D nition.1D nition

Parmi les reprsentations multirsolution sur base xe, seules les reprsentations sous-chantillonnes ont un intrt pour la compression. La version sous-chantillonne de la transforme en ondelettes isotrope non sous-chantillonne est la pyramide la-placienne "BA83]. C'est une des premires et des plus simples reprsentations multi-rsolution utilisables en compression. Elle est ne de la volont d'unier le codage pr-dictif et le codage bas sur les transformes dcorrlantes. Elle consiste d'abord trans-former l'image en une suite d'images sous-chantillonnes et lisses par des gaussiennes. + partir d'une image grossire, il est possible de prdire l'image de rsolution juste plus ne et de coder l'erreur de prdiction. La reprsentation est donc une pyramide d'images dont la taille est divise par deux entre chaque rsolution. Chaque image correspond une bande de dtails, sauf l'image au sommet qui est une bande d'approximation. Cette pyramide est dite laplacienne cause de l'quation de diusion faisant que la dirence entre deux images lisses est une approximation du laplacien. La gure 4.6

0 0.2 0.4 0.6 0.8 1 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 Facteur de dilatation Répétabilité r p (1:5) r ps (1:51:6) r psthheta (1:51:615) r d (1:5) 0 0.2 0.4 0.6 0.8 1 0 10 20 30 40 50 60 70 80 Angle de rotation Répétabilité r p (1:5) r ps (1:51:6) r ps (1:51:615) r d (1:5)

Fig. 4.7 Pyramide laplacienne : rptabilits en fonction du changement d'chelle (gure de gauche), et en fonction de l'angle de rotation de l'image tourne (gure de droite).

montre les bancs de ltres d'analyse et de synthse. Contrairement la transforme discrte en ondelettes sparables, la reprsentation multirsolution ne conduit qu' une seule bande (isotrope) par niveau de rsolution. La bande des coecients de dtails n'est pas sous-chantillonne, seule la bande des coecients d'approximation l'est. La redondance de la pyramide laplacienne est susamment faible pour la rendre intres-sante pour la compression, elle est infrieure P

1 j=0 4 ;j = 4

3. Comme dans l'algorithme de Mallat, les coecients d'approximation s

p n

x n

y

] l'chelle p se calculent partir de ceux l'chelle prcdente par convolution et dcimation :

s p n x n y ]= X k x k y 2ZZ h2n x ;k x 2n y ;k y ]s p;1 k x k y ] (4.7)

Les coecients de dtails c p

n x

n y

]constituent une erreur de prdiction :

c p n x n y ]=s p n x n y ]; X k x k y 2ZZ g2n x ;k x 2n y ;k y ]s p;1 k x k y ] (4.8)

La reconstruction la plus simple est donne par :

s p n x n y ]=c p n x n y ]+ X k x k y 2ZZ g2n x ;k x 2n y ;k y ]s p;1 k x k y ] (4.9)

La reconstruction optimale, au sens de la minimisation de l'erreur quadratique en pr-sence de bruit blanc uniformment rparti dans chacune des sous-bandes, est de com-plexit lgrement suprieure, et est prsente dans "DV03].

4.2.2 Description locale

Le sous-chantillonnage rend la pyramide laplacienne variante aux translations et aux rotations. Nanmoins, le sous-chantillonnage n'a lieu que dans la bande d'approxi-mation, ce qui limite considrablement cette variance. La transposition de la description SIFT dans les pyramides laplaciennes est prsente dans cette section.

Dtection de points d'intrt, et d'chelles caractristiques. L'extraction de maxima locaux en espace et en chelle devient dlicate cause des grilles de rsolu-tion variable en foncrsolu-tion de l'chelle. Les meilleurs rsultats ont t obtenus par ex-traction des maxima locaux en espace seulement, et en les localisant sur la grille de pleine rsolution par la technique de Loupias "LS99] prsente dans la section 3.3.2. L'chelle caractristique d'un point d'intrt est celle o) l'nergie normalise en chelle est maximale travers les chelles. En comparant les gures 4.3 et 4.7 donnant les rptabilits des caractristiques extraites partir des reprsentations en ondelettes non sous-chantillonnes et partir des pyramides laplaciennes, il appara$t que la d-gradation cause par le sous-chantillonnage est au pire de 50% (pour les rotations et les changements d'chelle de petit facteur). Le taux d'appariements corrects 1.5 pixels dni par la relation 1.32 (page 46) est, pour le type de copies utilis par la gures 3.17 (page 97) de 0:2=0:55 ' 0:36 pour la transforme en ondelettes chan-tillonnage critique. La gure 4.8 montre que ce taux devient 0:22=0:45 ' 0:5 pour la pyramide laplacienne. Une redondance faible permet donc de sensiblement amliorer la robustesse des caractristiques extraites. Enn, il est important de souligner que lorsque le facteur de dilatation correspond au facteur de sous-chantillonnage (gal deux dans toutes les reprsentations tudies par la suite), les reprsentations de l'image originale et de la copie se correspondent. Ceci explique le rebond important que marquent les rptabilits au facteur de dilatation gal deux.

Estimation d'orientation, et description des points d'intrt. L'isotropie des reprsentations par pyramide laplacienne implique un cot de description. Comme pour les reprsentations en ondelettes isotropes non sous-chantillonnes, les tentatives d'ex-traction robuste d'orientation directement dans le domaine transform ont chou. Une telle extraction est possible au prix de la reconstruction des bandes d'approximation chaque chelle. Le cot est faible, il est de N convolutions et de N additions par chelle, o)N est le nombre de coecients une chelle donne. L'orientation est alors estime partir de l'orientation du gradient des bandes reconstruites. L'nergie per-mettant de pondrer le poids des orientations est la norme du gradient. Les gures 4.7 et 4.8 montrent que les orientations ainsi extraites, et les descripteurs SIFT calculs partir de ces orientations, sont trs robustes. La pyramide laplacienne sera donc une des reprsentations choisies dans dans les schmas de compression prsents dans le dernier chapitre. Le reste du chapitre analyse des reprsentations directionnelles, de sorte disposer de l'information d'orientation sans avoir reconstruire l'image.

0 0.2 0.4 0.6 0.8 1 0 0.5 1 1.5 2 2.5 3 3.5 4 Répétabilité Precision"(pixels) r p (") r d (")

Fig.4.8 Pyramide laplacienne : rptabilits en fonction de la prcision de localisation des points extraits, pour une copie synthtise par dilatation de facteur 1.6, d'une rotation de 30 degrs, d'une compression JPEG de facteur 10, et d'un crop de facteur 30.

4.3 Transforme en contourlets