• Aucun résultat trouvé

Transforme en ondelettes non sous-chantillonne .1D nition

L'analyse multirsolution prsente dans la section 3.1.3 conduit l'algorithme de Mallat permettant de construire rcursivement les coecients d'ondelettes sur une grille dyadique sous-chantillonne. L'algorithme ' trous ( "Dut89, HKMMT89] permet de calculer les coecients d'ondelettes sur une grille dyadique non sous-chantillonne. Pour la compression, cette reprsentation est inadapte en raison de sa forte redondance, gale JN

b

+1, o)J est le nombre d'chelles analyses, etN

b le nombre de bandes par chelle. Elle est en revanche rpandue dans de nombreux traitements visuels requrant une reprsentation covariante aux translations.

Pour des signaux mono-dimensionnels, le calcul des coecients d'ondelettes sur grille non sous-chantillonne peut s'eectuer de deux fa&ons quivalentes. La premire consiste adapter l'algorithme de Mallat provenant de l'analyse multirsolution. + chaque itration sur le reste de basse frquence, il sut de calculer les convolutions avec les ltres passe-bas et passe-haut, non pas seulement aux coecients d'indices pairs, mais galement sur ceux d'indices impairs. Une fa&on quivalente de procder consiste, chaque itration, insrer des zros dans les ltres passe-bash et passe-hautgutiliss dans l'algorithme de Mallat. La gure 4.2 illustre l'opration d'insertion de zros

qui-Niveau 2 Niveau 1 Signal original

Fig.4.2 quivalence entre l'algorithme trous et l'algorithme de Mallat en considrant tous les dcalages possibles avant de sous-chantillonner.

valente l'opration de sous-chantillonnage. Les ltres h p et g

p utiliss la rsolution

p pour crer les coecients d'approximation s

p+1et de dtail c p+1 : s p+1 =h p ?s p c p+1 =g p ?s p

sont dnis par insertion de zros de sorte que h p

k] = hk=2 k

] si k=2

k est un entier et zro sinon. C'est pourquoi cet algorithme est connu sous le nom d'' algorithme trous (. La transforme en ondelettes non sous-chantillonne n'tant dnie que par des convolutions, elle est bien covariante aux translations. L'algorithme de reconstruction est galement similaire au cas sous-chantillonn :

s p = 1 2 ~ h p s p+1 +~g p c p+1 (4.1) o) les paires de ltres (h

~

h) et (g~g) n'ont plus tre bi-orthogonales. La condition 3.37, assurant que les recouvrements spectraux causs par le sous-chantillonnage s'an-nulent lors de la reconstruction, n'est plus ncessaire. La seule condition vrier est la condition de reconstruction parfaite 3.36. Cela conduit une plus grande libert dans le choix des ltres. D'autre part, la reprsentation n'tant pas sou-chantillonne, l'exten-sion aux signaux bidimenl'exten-sionnels peut s'eectuer avec une seule bande (isotrope) par octave, ce qui est intressant dans une perspective de description.

L'extension aux images peut s'eectuer par produit tensoriel et conduire trois bandes d'ondelettes par rsolution. Il est galement possible de se ramener une seule bande d'ondelette par rsolution en choisissant comme ondelette la fonction dnit par dirence de fonctions d'chelle :

1 4 ( x 2 y 2 )=(xy); 1 4 ( x 2 y 2 ) (4.2)

Il est alors souhaitable que la fonction d'chelle et l'ondelette soient isotropes. En choisissant h gaussien, et en l'approximant par un ltre binomial, les ltres d'analyse sont par exemple :

h 1D = 1 16 14641] h = h 1D h 1D (produit tensoriel) (4.3) g = Id;h (4.4)

0 0.2 0.4 0.6 0.8 1 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 Facteur de dilatation Maxima locaux en espace et en échelle

Répétabilité à 1.5 pixels r p (1:5) r ps (1:51:6) r d (1:5) 0 0.2 0.4 0.6 0.8 1 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 Facteur de dilatation Maxima locaux en espace seulement

Répétabilité à 1.5 pixels r p (1:5) r ps (1:51:6) r d (1:5)

Fig.4.3 Reprsentation en ondelettes non sous-chantillonne : rptabilits en fonc-tion du changement d'chelle pour les maxima locaux en posifonc-tion et en chelle (gure de gauche), et pour les maxima locaux en position seulement (gure de droite). Les copies sont des simples dilatations.

Il existe une grande libert dans le choix des ltres de synthse. La reconstruction la plus vidente est donne par ~

h =g~=Id. D'autres exemples de ltres de synthse sont proposs dans "SFM].

4.1.2 Description locale

La transforme utilise pour la description locale est isotrope. La bande d'approxi-mation et la bande de dtails sont respectivement calcules par convolution entre la bande d'approximation la rsolution prcdente et les ltresg etgtels que dnis par les relations 4.3 et 4.4. Les points d'intrt sont les plus forts maxima locaux en espace et en chelle de l'nergie dnie comme le carr des coecients de la bande de dtail. Leur chelle caractristique est l'chelle laquelle ils sont extraits. Aucune mthode d'estimation robuste d'orientations n'a t trouve dans le domaine transform. Une telle estimation requiert la reconstruction des bandes d'approximation. Se donnant B

p

la bande de basse frquence la rsolution p, l'orientation (xp) au point x et la rsolution p peut se dnir par:

(xp)=atan2( @B p (x) @x @B p (x) @y ) (4.5)

o) atan2 est la fonction dnie par la relation 2.3 (page 58). L'nergie E(xp) aecte (xp)pour le calcul du descripteur SIFT est dnie par :

E(xp)= s @B p (x) @x 2 + @B p (x) @y 2 (4.6)

0 0.2 0.4 0.6 0.8 1 1 1.2 1.4 1.6 1.8 2 " s P(b on appariemen t j " s ) 0 0.2 0.4 0.6 0.8 1 1 1.2 1.4 1.6 1.8 2 Répétabilité " s r p (1:5) r ps (1:5" s )

Fig.4.4 Reprsentation en ondelettes non sous-chantillonne : sensibilit de la robus-tesse des caractristiques extraites l'erreur d'estimation en chelle. Figure de gauche : probabilit de bon appariement (au sens de la dnition 11, page 46) sachant l'erreur d'estimation en chelle "

s (telle que dnie par la relation 1.25, page 44). Figure de droite : rptabilitr

ps (1:5"

s

) dnie par la relation 1.28.

L'orientation et l'nergie dnies en tout point permettent de calculer le descripteur SIFT tel que prsent dans la section 2.4 (page 62).

La transforme en ondelettes non sous-chantillonne ne prsente pas d'intrt pour la compression, mais permet de valider l'chantillonnage dyadique en chelle pour la dtection de points et le calcul des descripteurs SIFT. Les techniques classiques utilises en description d'images procdent un chantillonnage en chelle beaucoup plus n. Cet chantillonnage grossier en chelle est commun toutes les reprsentations tudies dans cette thse. Il est donc essentiel de valider l'chantillonnage dyadique en chelle dans une perspective de description.

Inuencedel'chantillonnagedyadiqueenchellesurladescription. L'chan-tillonnage dyadique en chelle est beaucoup plus grossier que celui classiquement utilis dans la littrature. Cela soulve deux questions.

1. Les maxima locaux en espace et en chelle sont-ils susamment stables pour l'ex-traction de points, d'chelles, et d'orientations? La gure 4.3 permet de comparer les rptabilits des maxima locaux en espace et en chelle avec celles des maxima locaux en espace seulement. Il appara$t que l'chantillonnage dyadique est encore susamment n pour que les maxima locaux en chelle soient robustes. La gure montre galement que les chelles et les descripteurs SIFT restent robustes dans le cas d'une discrtisation une seule voie par octave. Pour les reprsentations chantillonnage dyadique en chelle, le facteur de la ' pire (dilatation est gal

0 0.2 0.4 0.6 0.8 1 0 0.5 1 1.5 2 2.5 3 3.5 4 Répétabilité

Precision"(enpixels) l=5,r p (") l=9,r p (") l=3,r p (") r d (") r d (") r d (") 0 0.2 0.4 0.6 0.8 1 0 10 20 30 40 50 60 70 80 90

Angle de rotation (degrés)

Répétabilité r xs (1:51:6) r xs (1:51:615) r d (1:5)

Fig. 4.5 Reprsentation en ondelettes non sous-chantillonne. Figure de gauche : rptabilits en fonction de la longueur du ltre binomial. Les copies sont cres par dilatation d'un facteur 1.6, d'une rotation de 30 degrs, d'un crop 30%, et d'une com-pression JPEG de facteur 10. Figure de droite : rptabilits en fonction de l'angle de rotation de l'image tourne.

1.6, et sera, dans toute la suite, utilis pour crer les copies.

2. La sensibilit des descripteurs locaux aux erreurs d'estimation en chelle n'est-elle pas trop forte? Sur la gure 4.3, la rptabilit r

ps est value pour une erreur de localisation de 1.5 pixels, et une erreur d'estimation en chelle "=1:6 ("est dni par la relation 1.25, page 44). Ce choix est justi par la gure 4.4. Sur la gure de gauche, la probabilit de bon appariement sachant " =1:6 (et sachant qu'un point distant de moins 1.5 pixels existe) est susante, gale 40%. Sur la gure de droite, la probabilit qu'il existe un point extrait sur la copie "1:5

et" s

1:6est galement importante, gale 0.5.

Dans une perspective de description, un chantillonnage dyadique en chelle est donc possible.

Inuence desltres surla rptabilit. Le choix des ltreshcomme approxima-tion de gaussienne etg=Id;h permet d'approcher les coecients d'une laplacienne chantillonnage dyadique en chelle ( cause de l'quation de diusion 1.12, 31). C'est pourquoi il est possible de transposer directement ce type de reprsentation les tech-niques d'extraction de points et de description locale dveloppes dans l'espace-chelle gaussien et prsentes dans la section 2.3. En choisissant les ltres binomiaux comme approximations de la gaussienne, la gure 4.5 montre l'inuence de la longueur du ltre binomial sur la robustesse des points et des descripteurs locaux. Comme dans les repr-sentations en ondelettes chantillonnage critique o) l'ondelette de Haar conduit aux

s p s p g c p+1 s p+1 2:2" g h 2:2# 2:2"

Fig. 4.6 Un tage d'analyse ( gauche) et de synthse ( droite) de la pyramide laplacienne.

meilleurs rptabilits, les ltres binomiaux les plus courts, donc les moins rguliers, sont mieux adapts pour la dtection de points saillants. La perte de robustesse avec la longueur du ltre est toutefois minime.

Estimation d'orientation. La mthode la plus simple d'estimation d'orientation dans le domaine transform est de calculer l'orientation du gradient du signal trans-form. Les tentatives d'estimation directement dans le domaine transform ont choues. Parmi les techniques d'estimation robuste d'orientation prsentes dans la section 2.3, celles reposant sur le gradient peuvent facilement se transposer si l'on accepte de recons-truire les bandes d'approximation. Une telle reconstruction est peu coteuse puisqu'elle ne requiert queN convolutions chaque chelle, o) N est le nombre de pixels. L'orien-tation est celle maximisant l'histogramme des orienL'orien-tations voisines d'aprs la mthode prsente dans 2.3. Les descripteurs SIFT se calculent ensuite aisment partir de l'orientation et de l'nergie dnies par les relations 4.5 et 4.6. La gure 4.5 montre la bonne robustesse des descripteurs, pour une copie cre par simple rotation (gure de droite), et pour une copie plus svre (gure de gauche).

4.2 Pyramide laplacienne