• Aucun résultat trouvé

Chapitre 5. Conclusion générale

5.1 Synthèse de la recherche

5.1.3 Une approche d’estimation de la géométrie 3D de la scène

Le troisième sous-objectif de la thèse visait à proposer une approche permettant de calculer à partir d’une séquence d’images acoustiques, l’élévation de la scène observée, pour aboutir à une scène tridimensionnelle reconstruite conforme à la réalité. Nos travaux de recherche nous ont amené à proposer deux approches de reconstruction tridimensionnelle : une approche curviligne et une approche volumique. Le choix de ces deux approches a été fait avec pour objectif de tester deux versions du modèle géométrique de formation des images: une version simplifiée (approche curviligne) et une version "idéale" du modèle (approche volumique) qui permet également l'intégration des incertitudes de localisation des points saillants considérés.

5.1.3.1 Différences et points-clés des deux approches proposées

Dans la première approche (curviligne), le lieu géométrique dans la scène associé à un pixel dans l’image acoustique, se situe le long d’un arc de cercle. Cet arc de cercle est défini par la portée « r », l’azimut « θ » et un angle « • » situé dans un intervalle d’élévations qui correspond à l’ouverture verticale de la caméra. En revanche, l’approche volumique considère que le lieu géométrique dans la scène, d’un pixel de l’image, ne se situe pas le long d’un arc de cercle mais au sein d’un volume. Ce volume est délimité en portée et en azimut, par les quatre sommets d’un polygone P correspondant aux quatre « coins » du pixel considéré. Le modèle géométrique retenu en termes de formation des images, est donc la première différence entre ces deux approches. Par ailleurs, l’approche volumique considère chaque pixel comme un polygone dont les dimensions correspondent aux résolutions en portée et en azimut des images. Il est alors possible de modifier ces dimensions pour, d'une part intégrer les erreurs de localisation des points saillants (connaissance a priori), et d'autre part estimer les incertitudes résultantes de positionnement des points 3D reconstruits grâce au volume final représentant le lieu géométrique possible de chaque point reconstruit. Seule l'approche volumique permet de manipuler de telles quantités qui permettent d'associer à une scène reconstruite une

173 certaine quantification de sa précision de reconstruction. Cette méta-connaissance est clairement un atout lors de l'alimentation des systèmes, tels que les SIG 3D, qui vont exploiter les reconstructions 3D ainsi produites.

Même si les modèles géométriques de représentation des images diffèrent entre les deux approches, celles-ci reposent ensuite sur une mécanique commune et générique d'estimation du déplacement de la caméra entre les images. En effet, à partir du déplacement estimé, les coordonnées 3D (approche curviligne) ou volumes 3D (approche volumique) associés aux points saillants peuvent être estimés. Du fait de la complexité de l'espace de recherche d'un tel déplacement, l’algorithme d’optimisation qui a été retenu est l'algorithme SE- AMC (ou Stratégie d’Évolution avec Adaptation de la Matrice de Covariance) qui est issu de la famille des algorithmes évolutionnaires. L’une des particularités du SE-AMC est d'une part l’utilisation d’une matrice de covariance globale pour paramétrer les mutations gaussiennes, et d'autre part l'adaptation dynamique de cette matrice de covariance à partir des chemins cumulatifs de mutation ayant donné des solutions satisfaisantes. La force de SE-AMC dans ce contexte, est ainsi de permettre une recherche globale dans l'espace des solutions possibles (afin d'éviter des solutions sous-optimales) tout en restant efficace dans la convergence vers la meilleure solution courante.

5.1.3.2 Reconstruction 3D par primitives curvilignes

Plusieurs tests portant sur la reconstruction à partir de deux images et la reconstruction multi-images ont été réalisés. Dans les deux approches les mêmes points saillants extraits de différentes images et l’algorithme d’optimisation SE-AMC ont été exploités. À l’issu de chaque test les coordonnées 3D des points saillants ont été calculées et comparées avec les coordonnées réelles. Lors de l’application de l’approche curviligne, le résultat obtenu correspond au calcul des points d’intersection conjointe entre tous les arcs de cercle issus de la projection des points saillants selon le modèle géométrique. Ces points d’intersection définissent les points 3D recherchés. À défaut de l’obtention d’une intersection conjointe entre les arcs de cercle, ce sont les points qui produisent la distance la plus faible qui sont sélectionnés par l’algorithme de reconstruction.

Dans tous les tests de reconstruction 3D réalisés et présentés dans la section de l’approche curviligne, aucune fonction objective n’a atteint la valeur minimale zéro. Ceci indique que les arcs de cercle issus des points saillants ne se croisent pas. Cette « non intersection » est liée à la configuration des arcs de cercle dans la scène. Leur disposition les uns par rapport aux autres ne permet pas leur intersection. Par contre, ils se trouvent tous proches d’un même point 3D dans la scène. D’ailleurs, c’est la distance entre ce point 3D et tous les arcs de cercle qui est minimisée par la fonction objective. Une fois la fonction objective a atteint la valeur minimale, l’algorithme d’optimisation présente en sortie les solutions optimales du déplacement de la caméra. Dans les différents tests, ces déplacements ont été calculés avec une marge d’erreur élevée par rapport au déplacement effectif. D’ailleurs, l’impact de cette marge d’erreur est observé dans la reconstruction 3D des objets d’une part, dans l’erreur de calcul des coordonnées 3D où la comparaison des coordonnées 3D

avec les coordonnées réelles des points saillants associés aux objets présents dans la scène a révélé la présence d’une marge d’erreur élevée selon les trois axes (X, Y et Z) et, d’autre part, dans le décalage uniforme en position entre tous les points reconstruits et tous les points réels. En effet, les tests de reconstruction (avec 2 images, 3 images et 4 images) conduisent, toujours, à une distribution spatiale identique des points. Cette disposition est conforme à la disposition réelle des points dans la scène. Elle caractérise, par conséquent, fidèlement la géométrie des objets.

Il est à noter, aussi, que malgré l’erreur affectant les déplacements estimés on a observé une cohérence dans les résultats avec la géométrie d’acquisition. Ceci est observé lors de la reconstruction à partir de trois et quatre images au niveau de deux points :

1) dans les translations estimées entre l’image 2 et l’image 3. Ces images, acquises quasiment de la même position, ont des translations estimées très proches par rapport à l’image 1.

2) dans l’estimation de la rotation effectuée entre l’image 1 et l’image 4. Cette dernière est acquise d’une position située à l’opposé de la position d’acquisition de l’image 1, alors, la rotation calculée selon l’axe des Z par rapport aux valeurs de la rotation selon l’axe des X et des Y est plus élevée. Elle correspond à la réalité de la configuration d’acquisition des images.

Finalement, d’après les résultats obtenus et discutés dans le chapitre 4, la reconstruction par primitives curvilignes n’a pas abouti à une bonne reconstruction de la scène. Certes, l’erreur de la reconstruction peut provenir, en partie, d’une imprécision dans les mesures lors de l’acquisition ou d’une imperfection issue des traitements appliqués aux images; mais en grande partie, l’erreur est due à l’utilisation d’un modèle géométrique simplifié. Ceci est confirmé par les résultats de l’approche volumique où le modèle géométrique idéal est utilisé. Ces résultats sont synthétisés dans le paragraphe suivant.

5.1.3.3 Reconstruction 3D par primitives volumiques

L'approche volumique permet d'estimer les déplacements de la caméra qui permettent à tous les rubans correspondant à un même point saillant d’avoir une intersection conjointe en un volume commun, et cela pour tous les points saillants extraits des différentes images. Les résultats obtenus sont, donc, de nature différente de ceux issus de l'approche curviligne. En effet, cette approche fournit une plage en distance, en azimut et en élévation pour chaque point reconstruit. Cette plage en distance permet de déduire l’ensemble de coordonnées 3D possibles pour un point saillant.

Les expérimentations conduites sur les données acquises en bassin ont montré que les coordonnées réelles des points saillants se retrouvaient (ex. les points de la boite) dans les plages estimées par l'algorithme de reconstruction proposé. Il a aussi été montré que plus le nombre d'images utilisées augmente, plus les plages

175 estimées se réduisent autour des coordonnées réelles des points de la scène (ex. les points de la grille). En effet, pour chaque point saillant, chaque image supplémentaire fournit un ruban de plus avec une orientation différente (du fait du point de vue différent de la caméra).

En utilisant des primitives volumiques, la fonction objective minimise non seulement la distance, en azimut et en portée (tel que pour l’approche curviligne), mais de plus la distance en élévation entre tous les rubans. La minimisation de la distance en élévation permet d’extraire les zones d’intersection commune en élévation entre tous les rubans volumiques. Dans tous les tests de reconstruction 3D (avec 2 images, 3 images et 4 images), la fonction objective a atteint la valeur minimale zéro indiquant l’obtention d’une intersection conjointe. Ceci met en évidence deux points :

1) La configuration des primitives volumiques dans la scène permet leur intersection. En fait, ceci est lié à leur résolution en portée et en azimut. Dans les expérimentations réalisées dans cette thèse, ce sont les résolutions suivantes qui ont permis d’aboutir à des intersections entre les rubans et d’estimer les coordonnées 3D des points saillants : (∆r = 0,1 m & ∆θ = 0,9° et ∆r = 0,2 m & ∆θ = 0,9°).

2) L’utilisation du modèle géométrique idéal a favorisé l’intégration de la résolution et, par conséquent, le calcul des volumes d’intersection.

Malgré la différence entre le principe d’utilisation de primitives respectivement volumiques et curvilignes, certains résultats sont semblables. Ces derniers concernent, premièrement, la disposition des volumes reconstruits dans la scène. Ils respectent aussi la géométrie réelle des objets. De plus, en augmentant le nombre d’images, l’écart en hauteur entre les points de la boite et les points de la grille s’approche de l’écart réel. La deuxième ressemblance, dans les résultats, est observée au niveau des déplacements estimés. Dans certains tests (reconstruction à partir de deux images), les déplacements estimés par approche curviligne et par approche volumique sont proches. Toutefois, malgré ces points de ressemblance dans les résultats, les coordonnées 3D estimées par l’approche volumique sont meilleures. Comme évoqué, ci-haut, on retrouve les hauteurs réelles des points saillants dans les intervalles de hauteurs calculés.

En conclusion, au travers des résultats obtenus à partir des deux approches de reconstruction 3D proposées (l’approche curviligne et l’approche volumique), le troisième objectif spécifique de la thèse « Reconstruction 3D » est atteint. La comparaison des résultats de ces deux approches a permis de déduire que l’approche volumique répond le mieux aux caractéristiques des images des caméras acoustiques (notamment en utilisant le modèle géométrique idéal de formation des images) et qui fournit une reconstruction proche de la réalité en termes de précision des hauteurs calculées.

5.2 Principales observations tirées des approches développées

Documents relatifs