• Aucun résultat trouvé

La méthode d'appariement choisie

Chapitre 5 L'alignement géométrique des données

1.2 La méthode d'appariement choisie

La méthode de recherche de l'homologue d'un point particulier pr de l'image de référence que nous avons choisie revient à évaluer des mesures de similarité entre le point pr et un ensemble de points de l'image de travail appelé zone de recherche. Cette zone est généralement centrée

sur une pré-estimation notée et de l'emplacement de l'homologue dans l'image de travail, correspondant, le plus souvent, à un nœud d'échantillonnage. L'extension de cette zone de recherche est directement liée à une majoration de l'erreur d'appariement de la pré-estimation. Il est à noter que la complexité de l'estimation de la disparité croît linéairement avec le nombre de pixels de la zone de recherche : cette dernière doit donc être la plus petite possible pour limiter le nombre de calculs à effectuer pour l'appariement.

Ces différentes mesures de similarité constituent une matrice de similarité ayant pour taille celle de la zone de recherche. L'emplacement du maximum de similarité dans cette matrice correspond alors à l'emplacement estimé de l'homologue du point pr. De manière plus précise, si d~max est l'estimation de l'emplacement du maximum dans la matrice de similarité, l'estimation de la disparité au point pr est alors :

dp~r→t(pr) = et - pr + d ~

max [C-4]

Les différentes possibilités de recherche du maximum dans la matrice de similarité sont développées dans le paragraphe suivant.

Dans notre étude, nous avons choisi comme mesure de similarité le coefficient de corrélation linéaire centré et normalisé entre deux vignettes de même taille, dites vignettes de contexte. Plus précisément, soient :

• Vr la vignette de contexte, extraite de l'image de référence, centrée sur le point pr dans l'image de référence ;

• Vt(d) la vignette de contexte, extraite de l'image de travail, centrée sur le point "courant"

et+d, correspondant au décalage d dans la zone de recherche.

La fonction de corrélation, correspondant au décalage d = [dl,dc]t par rapport à la première estimation de l'appariement et, est définie par la relation :

C(d) = VrVt(d)



- Vr Vt(d)

σr.σt(d) [C-5]

Où :

• A désigne la moyenne des radiométries de la vignette A ;

• σr est l'écart type des radiométries de la vignette de contexte Vr ;

L'ensemble du processus d'appariement est résumé sur la figure C-1.

Image de référence Image de travail

Zone de recherche (2rc+1) x (2rl+1) pr Vr(pr) dl dc Evaluation d’une mesure

de similarité au point d = (dl,dc)

Itération pour (dl,dc) ∈ [-rl,rl]x[-rc,rc]

Fonction de similarité discrète C(d) Recherche sub-pixellaire de l’emplacement du maximum de C Vt(d) et d et+d

Pré-estimation de l’homologue et Nœud d’échantillonnage

Figure C-1. Principe de la constitution de la matrice de similarité (fonction de corrélation discrète centrée normée) suivant une zone de recherche.

Le choix du coefficient de corrélation centré normé comme mesure de similarité correspond à un choix classique (Paparoditis, 1998 ; Pratt, 1991 ; Leclerc, 1987). Il est possible de montrer que ce choix est optimal pour les conditions suivantes :

• les bruits de mesure br et bt sont assimilables à des bruits blancs gaussiens de moyenne nulle et de variance suffisamment faible par rapport à celles des mesures (contexte de fort rapport signal à bruit) ;

• il existe une relation linéaire entre les deux mesures ;

• la disparité entre les deux images correspond à une simple translation constante, notée δ.

On peut montrer que, sous ces conditions, la détermination de la translation par localisation du maximum de la fonction de corrélation correspond à une méthode d'estimation du

maximum de vraisemblance (Tassi, 1989). Cette approche consiste à choisir comme

estimation de la translation δ le décalage qui maximise la loi de vraisemblance régissant la probabilité des observations (ici le signal mt) sachant la translation entre les deux signaux.

Il est à noter qu'il existe, pour ces mêmes conditions, d'autres approches pour la détermination de cette translation. Ainsi, Igbokwe (1999) propose une méthode qui permet de déterminer le coefficient multiplicatif, le biais et la translation qu'il faut appliquer au signal de référence mr pour produire un signal le plus proche possible, au sens des moindres carrés, de mt. Cette approche présente toutefois l'inconvénient de devoir procéder de manière itérative à des développements limités à l'ordre 1 pour "linéariser" le système, soulevant ainsi des problèmes de validité de cette approximation ainsi que des problèmes pour le calcul des gradients des images.

Les conditions énoncées précédemment n'étant que très rarement totalement vérifiées, l'appariement par la méthode d'estimation du maximum de vraisemblance repose essentiellement sur sa robustesse vis-à-vis des différents écarts à ces conditions.

Cette remarque a notamment une implication sur la taille des vignettes de contexte. Ces dernières doivent être suffisamment grandes pour constituer un contexte statistiquement représentatif, stable et robuste pour la mesure du coefficient de corrélation. A l'inverse, elles doivent être suffisamment petites pour que l'hypothèse d'une translation constante entre les deux vignettes de contexte soit justifiée. La mesure de disparité à partir d'une vignette de contexte d'une certaine taille peut être vue comme le résultat d'un moyennage (filtrage passe- bas) des disparités réelles. En d'autres termes, pour que l'effet de lissage ne soit pas pénalisant pour l'estimation des disparités géométriques, la taille de la vignette de contexte doit être plus petite que l'échelle caractéristique spatiale du champ de disparité entre les deux images. Dans le cas contraire, le filtrage induit par une taille de vignette trop grande atténue des plages de fréquences spatiales significatives du champ de disparité que l'on cherche à estimer.

Comme l'indique Paporoditis (1998), ce compromis sur la taille de la vignette de contexte est intrinsèquement lié à la forme et au contenu du paysage et peut donc être envisagé de manière locale : on parle alors de corrélation adaptative. Cette adaptation peut être uniquement vis-à- vis de l'information radiométrique de la vignette de contexte : ainsi, Levine et al. (1973) proposent d'adapter la vignette de contexte par rapport à la variance locale de l'image de référence. Lotti et Giraudon (1994) puis Paparoditis (1998) proposent une adaptation de la taille de la vignette de contexte aux contours de l'image, de façon à préserver au mieux les discontinuités du champ de disparité.

Ces techniques d'adaptation de la taille de la vignette de contexte, uniquement basées sur les images, ne sont pas réellement complètes car elles ne tiennent pas compte des échelles de variabilité spatiale du champ de disparité sous-jacent. Puisque ce champ est inconnu, une approche prenant en compte cette variabilité spatiale doit s'inscrire dans une schéma itératif

où une première estimation du champ de disparité est utilisée avec une taille de vignette de contexte fixe pour pouvoir, ensuite, adapter localement la taille de cette vignette à la variabilité de ce premier champ lors d'une deuxième estimation (Okatumi et Kanade, 1992).