• Aucun résultat trouvé

faut au minimum deux observations `a des positions diff´erentes pour contraindre la recons- truction d’un amer. De plus la localisation de la cam´era et la reconstruction de la carte sont obtenus `a un facteur d’´echelle pr`es. Dans certaines applications, notamment en r´ealit´e augment´ee ce facteur n’est pas toujours important. Cependant pour une application de na- vigation autonome il est dans certains cas indispensable d’avoir une localisation `a l’´echelle, par exemple pour envoyer des commandes coh´erentes au robot. Pour corriger ce facteur, il est possible d’utiliser des capteurs proprioceptifs tel que dans Royer et al. (2005). Une seconde solution est d’utiliser un syst`eme de st´er´eo vision, c’est `a dire deux cam´eras reli´ees rigidement entre elles, dont la position est parfaitement connue (obtenue lors d’une phase d’´etalonnage). Ces syst`emes facilitent le probl`eme de SLAM , car l’observation de l’infor- mation 3D est possible sans devoir estimer simultan´ement la localisation, et sans n´ecessiter de d´eplacements sp´eciaux de la cam´era pour assurer l’observabilit´e. D’autres approches as- socient un capteur ext´eroceptif de type t´el´em`etre laser `a une cam´era tel queGallegos et al.

(2010), ce qui permet d’obtenir directement une information m´etrique de profondeur dans les images.

1.4

M´ethodes avec apprentissage

Un algorithme de SLAM en temps r´eel n’´etant pas envisageable `a grande ´echelle pour la localisation d’un robot, il est possible de d´ecoupler le probl`eme en deux parties :

1. La cartographie, la partie la plus complexe, peut ˆetre trait´ee hors-ligne lors d’une phase d’apprentissage.

2. La carte obtenue peut alors ˆetre utilis´ee en ligne, pour localiser efficacement une cam´era naviguant `a l’int´erieur du mod`ele.

Ce genre d’approche a plusieurs avantages, d’une part la localisation peut ˆetre effectu´ee avec pr´ecision et sans d´erive, grˆace au mod`ele. De plus si le mod`ele 3D est `a l’´echelle, la localisation visuelle peut ˆetre effectu´ee avec une cam´era monoculaire, `a l’´echelle ´egalement. Ce type de m´ethodes, peut ´egalement ˆetre class´e en deux groupes : l’utilisation de mo- d`eles 3D, obtenus soit par conception assist´e par ordinateur (CAO), soit avec une m´ethode de reconstruction automatique, et les mod`eles de type ”m´emoires images”, consistant `a distribuer dans l’environnement des images acquises lors de la phase d’apprentissage, sans reconstruire explicitement le mod`ele 3D global.

1.4.1

Mod`eles 3D

Certains algorithmes exploitent directement un mod`ele CAO de l’objet `a suivre (cf.

Brown (1971); Lowe (1991); Marchand et al. (2001); Drummond et al. (2002); Vacchetti et al.(2004);Comport(2005);Comport et al. (2006)). La position de la cam´era est estim´ee par rapport `a l’objet en minimisant l’erreur de re-projection entre le mod`ele 3D de la cible et les contours extraits dans les images. Cependant ces algorithmes n´ecessitent une bonne mod´elisation des objets ainsi que des primitives visuelles structur´ees dans les images, telles que des droites pour fonctionner.

Plusieurs travaux ont ´et´es men´es pour am´eliorer les techniques de localisation en envi- ronnement urbains en utilisant un mod`ele CAO.Lothe et al.(2010) utilisent un mod`ele 3D global approximatif, pour recaler en ligne une carte locale reconstruite par un algorithme de SLAM visuel avec la partie g´eom´etrique du mod`ele, afin de corriger la d´erive. DansCappelle

(a) Image synth´etique. (b) Mod`ele 3D textur´e.

Fig. 1.2 –(a). Une image synth´etis´ee `a partir du mod`ele 3D textur´e(b). Source : Institut G´eographique National (IGN).

et al. (2011), le mod`ele 3D est seulement utilis´e pour d´etecter les obstacles entre les images per¸cues par une cam´era et les images virtuelles, la localisation de la cam´era ´etant obtenue par GPS -RTK. Dans Irschara et al.(2009), un mod`ele ´eparse de points 3D reconstruit par un algorithme de SfM est utilis´e pour localiser une cam´era par un appariement de points SIFT .

En g´en´eral, ces mod`eles repr´esentent d’une mani`ere approximative l’environnement ou les objets `a suivre dans les images. Bien que les m´ethodes de reconstruction automatique d’environnement urbains `a grande ´echelle deviennent de plus en plus pr´ecises Hammoudi et al.(2010);Craciun et al.(2010);Lafarge & Mallet(2011), les outils utilis´es et les mod`eles reconstruits sont principalement d´edi´es `a des applications de r´ealit´e virtuelle (cf. figure1.2). En effet ce genre de mod`ele, obtenu par plaquage de textures sur un bˆatit 3D approximatif (fa¸cades planaires), ne permet pas un rendu photo-r´ealiste de l’environnement et comporte des erreurs de mod´elisation et des inconsistances photom´etriques. Pour ˆetre robuste `a ces er- reurs,Caron et al.(2012) proposent d’utiliser l’information mutuelle (Viola & Wells(1995)) pour recaler une image de synth`ese, g´en´er´ee `a partir d’un mod`ele 3D textur´e avec une image r´eelle. Cette m´etrique permet de traiter des images de modalit´es diff´erentes, cependant les calculs n´ecessaires pour l’alignement ne sont pas temps-r´eel.

DansNewcombe et al. (2011b), le mod`ele 3D dense obtenu par un algorithme de SLAM est r´e-utilis´e pour localiser une cam´era avec une m´ethode directe, pour une application de r´ealit´e augment´ee. La pose de la cam´era est estim´ee en minimisant directement les intensit´es de l’image courante, avec celles de l’image virtuelle. Bien que le mod`ele soit quasiment photo-r´ealiste, l’espace de reconstruction est restreint `a un environnement r´eduit (e.g. bureau).

Documents relatifs