• Aucun résultat trouvé

Transformes orientables .1D nition.1D nition

Interpolation de fonctions chantillonnes. Dans la transforme en ondelettes chantillonnage critique, les ltres passe-bas et passe-haut n'tant pas idaux, la fr-quence d'chantillonnage dans chaque sous-bande est infrieure la frfr-quence de Ny-quist. En utilisant des bandes orthogonales, il est nanmoins possible de reconstruire parfaitement le signal. Il n'est, en revanche, pas possible d'interpoler les coecients transforms aux positions chantillonnes. Dans le cas de signaux continus, un pro-blme classique est de savoir dans quelles conditions la convolution d'un signalf(x)par un noyau h(x) peut tre chantillonne sans perte d'information. La frquence mini-male d'un tel chantillonnage est la frquence de Nyquist gale la bande-passante du noyauh. Dans le cas o) le signalf(x)admet une dcomposition en srie de Fourier (en particulier les signaux priodiques ou support compact), une formulation analytique des fonctions d'interpolation est donne dans "FA91]. Considrant sans restriction que le signal est priodique de priode2, lesN coecientsyn]uniformment chantillonns s'crivent : yn]= Z 2 0 f(x)h(n x ;x)dx (4.18) o)

xest le pas d'chantillonnage. La transforme est dite ' translatable ((plus connue sous le nom anglais ' shiftable () s'il existe des fonctions d'interpolationb

n (x

0

) permet-tant de reconstruire le signal en tout point x

0 : 8x 0 f(x 0 )= Z 2 0 f(x)h(x 0 ;x)dx= N;1 X n=0 b n (x 0 )yn] (4.19)

Pour que cette relation soit vraie pour tout signalf(x), le noyau h doit vrier :

8x 0 h(x 0 ;x)= N;1 X n=0 b n (x 0 )h(n x ;x) (4.20)

Le signal f tant priodique, le noyau h peut galement tre considr priodique. Notanth(x) = P N;1 k=0 H(k)e 2j k

N la srie de Fourier deh, la relation prcdente s'crit :

8x 0 k H(k)e jkx 0 =H(k) N;1 X b n (x 0 )e jkn x (4.21)

Fig. 4.14 Premier banc de ltres utilis dans une reprsentation orientable. Un deuxime banc de ltres directionnels est appliqu sur chacune des bandes hautes. Deux noyaux h partageant le mme ensemble fk

0 k 1 :::k M;1 g de frquences pour lesquellesH est non nulle, ont donc le mme ensemble de fonctions d'interpolation. Consquences pour la description. Deux rsultats sont trs importants pour le problme de description, et sont respectivement dmontrs dans "SAH92] et "FA91].

Le premier rsultat est une caractrisation des transformes ' translatables (, permettant d'obtenir des reprsentations strictement covariantes aux translations. Une transforme multirsolution est ' translatable (si l'nergie globaleP

N;1 n=0

jyn]j 2

est invariante aux translations (ce qui est quivalent un recouvrement spectral inter-bandes nul).

Le second rsultat est la possibilit de construire des ltres orientables partir de la relation 4.21. Un ltre est orientable si la composante polaire de sa transforme de Fourier est ' translatable (. Un exemple simple est donn par le ltre orient selon 0 et dni par h

0

( r)=cos( ; 0

)c(r), o) c(r) est un ltre symtrique quelconque. Des relations trigonomtriques standards montrent en eet que la rponse impulsionnelle du ltreh

0 peut tre interpole partir des rponses des ltresh 0 eth 2 par h 0 =cos ( 0 )h 0 +sin( 0 )h 2

La conception de ltres orientables a t introduite dans "FA91].

Implmentation. Dans "SAH92] est propose une implmentation par banc de ltres d'une transforme multirsolution sous-chantillonne ' translatable (et orientable. La transforme est sparable dans le domaine de Fourier et dnie parT(! )=U(!)H( ). Un premier banc de ltres dcompose le signal en une bande haute sur laquelle opre

un second banc de ltres orientables, et une bande basse sur laquelle est itre la d-composition. Pour que la transforme soit ' translatable (, il ne doit pas y avoir de re-couvrements spectraux inter-bandes. Cela peut s'approcher en utilisant comme premier banc de ltres la pyramide laplacienne illustre par la gure 4.14, o) la bande haute est ltre par un passe-bande, et la bande basse par un passe-bas puis sous-chantillonne. La rponse du systme s'crit :

S(!) =jB(!)j 2 +jL 1(!)j 2 jL 0(2!)j 2 (4.22)

CommeB(!) est passe-bande et lesL

i(!) passe-bas,S(!) est passe-bas. La reconstruc-tion du signal requiert donc le calcul d'un reste passe-haut

R(!) = 1;S(!) (4.23)

Pour mettre en cascade le systme selon le schma de la gure 4.14, la rponse du systmeS(!) doit tre gale jL

0(!)j 2, conduisant : jL 0(!)j 2 =jB(!)j 2 +jL 1(!)j 2 jL 0(2!)j 2 (4.24)

Le second banc de ltres dcompose B(!) en N bandes directionnelles orientables. En choisissant comme rponse directionnelle

H( ) = cos3( ) = 14 cos(3 ) + 34 cos( ) (4.25) les fonctions d'interpolations, donnes par la relation 4.21, sont :

b

n( ) = 12 (cos( ;n) + cos(3( ;n))) 0n3 (4.26)

o) =

4. La redondance d'une reprsentation orientable sur J octaves n bandes directionnelles par octave est leve et vaut 1 +P

J;1 j=0 (1 4)j '1 +4 3 n. 4.5.2 Description locale

Le premier banc de ltres dcrit par la gure 4.14 est x. La rponse impulsionnelle

L

1(!) est celle d'un ltre binomial de longueur 7, et la rponse L

0(!) est construite pour tre unitaire entre 0 et

2 et nulle en par un ltre de longueur 13. Le deuxime banc de ltres dcompose la bande de haute frquence du premier banc de ltres partir de ltres dont la composante polaire de la transforme de Fourier est de la forme

H k( ) = cosk( ). Notant B pn lan bande directionnelle (1nN), etb n lan fonction d'interpo-lation, l'nergie au point x l'chelle p est dnie par :

E p(x) = max 0 <2 X 1 n N b n()B pn(x) (4.27)

et l'orientation par : p(x) = arg max 0 <2 X 1 n N b n() (4.28)

Les meilleurs rsultats ont t obtenus en extrayant les plus forts maxima locaux de l'nergieE

p ainsi dnie, et en recalant les points sur la grille de pleine rsolution par la mthode de Loupias. L'chelle d'un point est l'chelle de la plus nergie travers les chelles. L'orientation et l'nergie permettent de transposer directement la description SIFT prsente dans la section 2.4.

Dtermination du nombre de bandes directionnelles. Il est montr dans "FA91] que le nombre minimal de bandes directionnelles pour construire la rponse H

k( ) du deuxime banc de ltres orientables estk. La slectivit angulaire cro$t avec le nombre de bandes. La gure 4.15 montre que la robustesse des orientations extraites au niveau des points d'intrt n'est pas amliore avec le nombre de bandes directionnelles. Le nombre de bandes choisi pour le problme conjoint de compression et de description est donc gal 2, de sorte minimiser la redondance de la reprsentation.

valuation d'une reprsentation orientable deux bandes. La gure 4.16 montre les bonnes rptabilits pour les dilatations, et pour une transformation s-vre compose d'une dilatation, d'une rotation, d'un crop, et d'une compression JPEG. Il est intressant de comparer cette gure avec la gure 4.8 donnant les rptabilits pour le mme type de copie, mais pour des caractristiues (points et descripteurs SIFT) extraites partir de pyramide laplacienne. Le premier banc de ltres utilis dans les reprsentations orientables est galement une pyramide laplacienne. Le deuxime banc de ltres, non sous-chantillonn, ne dgradent que faiblement la robustesse des points extraits : la rptabilit 1.5 pixels est de 0.45 pour les pyramides laplaciennes, et de 0.4 pour les pyramides orientables. L'estimation d'orientation est, en revanche, plus coteuse en temps de calcul (elle ncessite le calcul des bandes d'approximation) et moins able dans les pyramides laplacienne que dans les pyramides orientables. + une prcision de 1.5 pixels, la rptabilit par descripteur le plus proche passe de 0.22 dans les pyramides laplaciennes 0.28 dans les pyramides orientables.

4.6 Conclusion

Des transformes multirsolution redondantes, isotropes ou directionnelles, ont t analyses dans un but de description locale. Les bonnes performances de description dans les reprsentations en ondelettes non sous-chantillonnes permettent de valider l'chantillonnage dyadique en chelle. Les techniques classiques de description locale uti-lisent un chantillonnage beaucoup plus n en chelle pour un gain pouvant tre faible. La pyramide laplacienne est une reprsentation isotrope et requiert la reconstruction de l'image pour l'estimation de l'orientation. Elle est nanmoins intressante pour le

0 0.2 0.4 0.6 0.8 1 0 10 20 30 40 50 60 70 80 Angle de rotation Répétabilité r p (1:5) r ps (1:51:6) r ps (1:51:615) r d (1:5) 0 0.2 0.4 0.6 0.8 1 0 10 20 30 40 50 60 70 80 Angle de rotation Répétabilité r p (1:5) r ps (1:51:6) r ps (1:51:615) r d (1:5)

Fig. 4.15 Reprsentation orientables : robustesse des caractristiques face aux rota-tions, pour deux bandes directionnelles (gure de gauche), et quatre bandes direction-nelles (gure de droite).

0 0.2 0.4 0.6 0.8 1 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 Facteur de dilatation Répétabilité r p (1:5) r ps (1:51:6) r ps (1:51:615) r d (1:5) 0 0.2 0.4 0.6 0.8 1 0 0.5 1 1.5 2 2.5 3 3.5 4 Répétabilité Precision"(pixels) r p (") r d ("

Fig. 4.16 Reprsentations orientables : rptabilits face aux dilatations (gure de gauche), et face une transformation plus svre compose d'une dilatation de facteur 1.6, d'une rotation d'angle 30 degrs, d'un crop de facteur 30%, et d'une compression JPEG de facteur 10.

problme conjoint de compression et de description, car elle est de faible redondance et conduit de bonnes rptabilits des caractristiques extraites. La pyramide laplacienne valide ainsi la possibilit de sous-chantillonner dans un but de description locale. L'in-vestigation de reprsentations directionnelles conduit des rsultats assez dcevants. De telles reprsentations sont potentiellement trs intressantes car orent la possibilit de dcrire pour un cot trs faible : les informations d'orientation et d'nergie sont direc-tement accessibles. Les bancs de ltres directionnels chantillonnage critique, comme les contourlets, conduisent des reprsentations trop variantes aux rotations pour tre utilisables en description. Les ondelettes complexes donnent de bons rsultats en esti-mation robuste d'orientation, mais pas en dtection robuste de points et d'chelle, cause de la grille la plus ne qui n'est que de taille le quart de celle de l'image ori-ginale. Les reprsentations orientables conduisent de bons rsultats pour tout type de transformation admissible, mais sont de redondance leve. Il existe nanmoins des techniques de codage pour ce type de reprsentations. Le chapitre suivant propose des schmas de compression adapts la description locale.

E ets de la compression sur la