• Aucun résultat trouvé

Flux optique sur la sphère, Nelson & Aloimonos

Nelson et Aloimonos [NEL 88] ont étudié la détermination du mouvement propre instantané d’un

mobile à partir de la vision depuis l’élément en mouvement, dans le cas où l’on dispose à la fois d’un champ de vision couvrant toute la sphère visuelle (ou presque) et du flux optique associé.

Nous devons justifier brièvement en quoi cela est relié au problème que nous nous posons. La dé-termination du mouvement propre instantané n’est, en effet, pas la même chose que la dédé-termination d’une direction à suivre pour rejoindre un but. Les deux problèmes se ressemblent formellement, ce qui apparaît si on remarque que le mouvement propre instantané correspond au mouvement infinité-simal qui s’est produit entre t et t + dt. Le mouvement instantané trouvé, dans le modèle de Nelson et Aloimonos, est l’équivalent, dans le problème de retour au nid qui nous intéresse, du mouvement fini qui a pu se produire entre la vue du but (qui équivaut à l’instant t) et la vue actuelle (qui équivaut à l’instant t + dt). L’opposé du vecteur vitesse trouvé est l’équivalent de la direction à suivre pour rejoindre le but. Remarquons que le cas de mouvement infinitésimal fait apparaître des simplifications quand t → 0 : il n’y a plus de distinction entre azimut mémorisé et azimut vu, donc plus de méthode directe, inverse ou moyenne. Le mouvement propre entre t et t + dt se confond avec le segment infini-tésimal reliant les vues en ligne droite, ce qui équivaut au cas où le trajet en ligne droite est le meilleur et aucun obstacle n’obstrue le parcours.

Nelson et Aloimonos expliquent pourquoi un champ de vision limité est essentiellement ambigu pour ce qui est de la détermination du mouvement propre. En effet, sur un champ de vision limité, les effets d’une rotation propre et d’une translation (deux mouvements très différents) peuvent être extrêmement ressemblants, avec pour conséquence que le calcul du mouvement devient très sensible

au bruit. Nous en donnons un exemple à l’aide de la figure4.1. Notons que la solution choisie par la

nature chez les mammifères est de ne pas s’appuyer sur la vision seule mais sur les informations don-nées par les capteurs gravito-inertiels situés dans l’oreille interne. En revanche, la vision panoramique

4.2. FLUX OPTIQUE SUR LA SPHÈRE, NELSON & ALOIMONOS 85

FIG. 4.1: Illustration de l’effet d’un champ de vision limité sur la difficulté d’estimer le mouve-ment propre. La photographie du haut est prise verticalemouve-ment au-dessus d’une table. Pour celle d’en bas à gauche, on a tourné l’appareil sur place pour viser vers la droite. Pour celle d’en bas à droite, l’appareil est à nouveau vertical mais translaté vers la droite. Les différences entre les deux photographies sont faibles (on voit principalement que sur la photographie de gauche les lignes horizontales ne le sont plus tout à fait, surtout sur le bord droit qui apparaît plus petit dans la photographie de gauche que dans celle de droite). Globalement, cela signifie qu’estimer simultanément la position et l’orientation de l’appareil sera très sensible au bruit de mesure.

FIG. 4.2: Exemples de flux purement translationnel et purement rotationnel obtenus en simulation en appariant deux images prises en deux positions distinctes (ce n’est donc pas au sens strict un flux optique de type dérivée temporelle comme dans la méthode de Nelson et Aloimonos, mais la différence est faible). Dans le cas translationnel (cadre de gauche), le flux optique est séparable en deux demi-cercles, l’un où il est de sens trigonométrique, l’autre de sens contraire, séparés par le point d’expansion en bas et le point de contraction en haut. Ce dernier indique la direction à suivre pour revenir au panorama central. Les valeurs de flux sont variables et dépendent de la distance des objets environnant. Dans le cas rotationnel (cadre de droite), les valeurs de flux sont constantes tout autour du cercle. Un flux quelconque est la somme d’un flux translationnel et d’un flux rotationnel.

4.2. FLUX OPTIQUE SUR LA SPHÈRE, NELSON & ALOIMONOS 87

Nelson et Aloimonos expliquent alors comment ramener le problème du mouvement propre 3D à trois déterminations du mouvement propre dans le cas 2D. En effet, moyennant une étape de recom-binaison, les résultats des trois déterminations 2D permettent d’obtenir le mouvement 3D.

4.2.1 Découpler pour réduire la complexité du problème

Le flux optique est un champ de vecteurs en chaque point d’une sphère. Chaque vecteur est tangent à la sphère. On n’essaye pas de trouver directement les 5 degrés de liberté du mouvement propre (3 de rotation et 2 de translations, car le vecteur vitesse 3D ne peut être estimé qu’à une homothétie près).

Au lieu de cela, on considère séparément trois plans équatoriaux orthogonaux deux à deux. Chaque plan intersecte la sphère suivant un cercle. Le flux optique le long de ce cercle n’est pas en général dans le plan du cercle (i.e. il a une composante orthogonale à ce plan). On considère la projection de ce flux optique dans le plan. On obtient un flux défini sur le cercle, chaque vecteur étant tangent au cercle. On peut appliquer à ce flux une méthode d’estimation du mouvement propre, mais à deux dimensions. On peut montrer que le mouvement propre obtenu (vecteur translation et vecteur rotation) est la projection du mouvement propre 3D sur le plan.

En appliquant l’analyse du mouvement propre à deux dimensions à chacun des trois plans or-thogonaux, on obtient des estimations de mouvement propre qui sont les projections du mouvement propre 3D sur les plans. Le mouvement propre 3D peut être reconstitué à partir de ces projections 2D. Nous choisissons de nous focaliser sur le cas à deux dimensions pour ne pas nous écarter du contexte dans lequel se placent tous les autres travaux.

La structure de la méthode 2D de Nelson et Aloimonos est assez proche de la structure com-mune aux autres méthodes étudiées dans cette thèse, de sorte que nous pouvons lui appliquer la grille

d’analyse que nous avons définie en2.1. La différence se situe dans les premières étapes (signature,

appariement), car les hypothèses ne sont pas tout à fait les mêmes.

4.2.2 Signature d’un lieu et appariement

Avant découplage du cas 3D vers le cas 2D sur lequel nous avons choisi de nous focaliser, cette méthode est essentiellement fondée sur l’utilisation du flux optique sur la sphère visuelle.

L’article de Nelson et Aloimonos est relativement théorique et n’explicite pas de méthode d’ex-traction de signature d’un lieu, ni d’appariement. Le modèle considère que le flux optique sur lequel il s’appuie est obtenu par une étape en amont qui lui est extérieure.

Par ailleurs, aucune implémentation dans le monde réel n’est évoquée dans [NEL 88]. Une telle

implémentation aurait nécessité d’expliciter cette étape en amont.

Toutefois, nous pouvons esquisser comment serait implémentée l’obtention du flux optique dans une application réelle d’après le contexte. Les méthodes traditionnelles de calcul de flux optique utilisent souvent essentiellement des contrastes de luminance et leur déplacement d’une image à

l’autre [BEA 95]. Les contrastes de luminance jouent alors le rôle de signature d’un lieu, et la mise en correspondance entre les deux images est l’équivalent de l’étape d’appariement. Notons cependant que la notion de flux optique suppose deux images obtenues à des instants très proches, de sorte que les mouvement mesurés sont proches des dérivées temporelles théoriques. C’est une différence par rapport aux autres modèles étudiés dans cette thèse, pour lesquels les écarts sont des différences finies et non des dérivées.

En résumé, ce n’est pas cette étape qui nous apprend le plus sur les liens entre le problème que se posent Nelson et Aloimonos et le notre. Le modèle suppose donc dans la suite qu’un flux optique sur la sphère (dans le cas 3D) ou sur le cercle (cas 2D) est disponible.

4.2.3 Calcul d’orientation et direction à suivre

Cette méthode s’appuie principalement sur les caractéristiques d’un flux optique translationnel : il est soit nul, soit caractérisé par un point d’expansion et un point de contraction diamétralement

opposés, et le mouvement de chaque côté du cercle va du premier vers le second (voir figure4.2).

En revanche, la composante rotationnelle du mouvement ajoute une constante au champ des vitesses, c’est-à-dire en chaque point un vecteur tangentiel au cercle de norme constante.

Dans ces conditions, trouver l’orientation actuelle se ramène à chercher quelle composante rota-tionnelle retirer du champ des vitesses pour obtenir un champ translationnel.

Pour ce faire, la méthode se donne une fonction de coût qui, pour une valeur donnée de l’orienta-tion actuelle et de la direcl’orienta-tion de translal’orienta-tion, estime en quoi le flux résiduel ne ressemble pas à un flux translationnel correspondant à ces deux paramètres. La fonction renvoie zéro si elle obtient bien un flux translationnel, et une valeur non nulle s’il y a des valeurs de flux optique dont le signe contredit les paramètres de mouvements testés. La valeur de cette fonction est proportionnelle aux causes de non-nullité.

La technique reste applicable même dans le cas où l’information de flux optique manque sur une portion de panorama, car cela ne perturbe pas forcément le calcul de la fonction de coût. Cette propriété est bienvenue, car disposer du flux optique sur une portion importante de la sphère visuelle n’est pas facile à obtenir avec les capteurs actuellement répandus. Il est toutefois important de disposer de plus d’un demi-tour de cercle, sinon il est impossible de trouver les deux points (expansion et contraction) et la méthode devient alors inapplicable en l’état.

4.2.4 Conclusion

De manière concrète et synthétique, on peut dire que la méthode de Nelson et Aloimonos permet de trouver les paramètres instantanés d’un mouvement (vitesse instantanée de rotation et vitesse ins-tantanée de translation) dans le cas où l’on dispose de mesures de flux optique sur une grande portion de la sphère visuelle. Elle semble potentiellement adaptable à d’autres cas, comme la reconstitution du mouvement d’ensemble, à condition de disposer d’une séquence continue d’images intermédiaires.