Notations, scénario et désignation des méthodes proposées

RECONSTRUCTIONS DE DROITES

8.3 Notations, scénario et désignation des méthodes proposées

Nous donnons nos notations conjointement à une description du scénario considéré. Nous étudions ensuite la formulation algébrique de l’estimation au maximum de vraisemblance, dont la fonction de coût sert de référence pour les méthodes sous-optimales proposées par la suite. Finalement, nous indiquons la notation utilisée pour désigner les différentes méthodes.

8.3.1 Notations et scénario

Nous considérons un scénario basé sur deux jeux de caméras indépendants. Les matrices de projection de ces caméras sont notées P₁, . . . ,P_npour le premier jeu et P

1, . . . ,P

n pour le deuxième. La notation avec un désigne le deuxième jeu d’images ou la deuxième reconstruction. Des droites sont localisées dans les images. La j^èmedroite dans l’image i est représentée par deux points notésxij etyij. Notons que l’on peut, sans perte de généralité, représenter toute droite image définie comme le meilleur ajustement à un ensemble de points, par deux points et deux poids, voir le chapitre 3, §3.3.2. Les équations de ces droites sont notées lij. Les droites sont reconstruites à partir des images, indépendamment pour chaque jeu de caméras. Chacune des deux reconstructions, notéesL₁, . . . ,Lm etL₁, . . . ,L_m, est exprimée dans un repère qui lui est propre. On suppose sans perte de généralité que le nombre de droites de chaque reconstruction, noté m, est identique, car seules les droites communes aux deux reconstructions sont utilisées pour l’alignement. Les coordonnées de Plücker des droites sont notées L₁, . . . , L_met L

1, . . . , L

m. Ces notations sont illustrées sur la figure 8.1.

8.3.2 Désignation et résumé des méthodes proposées

Le tableau 8.2 résume les différentes méthodes proposées. Les noms des méthodes sont construits comme suit. La nature de la transformation estimée est donnée parAFFpour une affinité ouSIMpour une similitude ou transformation rigide¹. Si ces deux termes sont absents, alors la méthode est conçue pour estimer une homogra-phie.LINindique les méthodes linéaires,QLINles méthodes quasi-linéaires etNLINles méthodes non-linéaires, basées sur l’algorithme de Levenberg-Marquardt. Le préfixe 3DLMM indique une méthode basée sur une ma-trice de mouvement pour droites 3D. Si ce préfixe est absent, et que la méthode est linéaire ou quasi-linéaire, alors la méthode est basée sur une formulation avec une matrice de mouvement usuelle (4× 4). Les méthodes

non-linéaires sont valables pour tous les espaces, c’est à dire tous les types de mouvement. La mention 2D ou 3D indique une erreur basée image ou exprimée en 3D. Le maximum de vraisemblance est notéMLE. On uti-lise le caractère * pour dénoter un ensemble de méthodes, par exemple 3DLMM_* désigne toutes les méthodes basées sur une matrice de mouvement pour droites 3D.

8.4 Maximum de vraisemblance

8.4.1 Formulation algébrique

Nous donnons la fonction de coût correspondant au maximum de vraisemblance, désigné par MLE (de “Maximum Likelihood Estimator” en Anglais). La forme de cette fonction de coût sert de référence pour les

Les méthodes sont proposées pour l’estimation d’une similitude et peuvent être spécialisées de manière triviale à l’estimation d’une transformation rigide.

8.4. MAXIMUM DE VRAISEMBLANCE 181

scène rigide

première reconstruction de droites

deuxième reconstruction de droites

mouvement G

premier jeu de caméras

deuxième jeu de caméras Lj l_1j l_2j P₁ P₂ Lj l_1j l_2j P 1 P 2 l₁₁ x₁₁ y₁₁ l₁₂ ^x12 y₁₂ l₁₃ x₁₃ y₁₃ l₁₄ x₁₄ y₁₄ _l 15 x₁₅ y₁₅ l₁₆ ^x16 y₁₆

FIG. 8.1 – Le scénario considéré pour l’alignement de reconstructions de droites. Deux jeux de caméras indépendants, P₁, . . . ,Pn et P

1, . . . ,P

n induisent deux reconstructions de la scène, notées L1, . . . ,Lm et L₁, . . . ,Lm. Ces deux reconstructions sont liées par une transformation 3D G inconnue.

méthode résolution type d’erreur résiduelle sym. # corresp. estimation linéaire ou quasi-linéaire d’une homographie, §8.5.1

LIN_3D linéaire 3D, algébrique, point-plan non 5

LIN_2D linéaire image, algébrique, point-droite non 5

QLIN_2D quasi-linéaire image, Euclidienne, point-droite non 5

3DLMM_LIN_3D linéaire+extraction 3D, algébrique, droite-droite non 7 3DLMM_LIN_2D_1 linéaire+extraction image, algébrique, droite-droite non 7 3DLMM_LIN_2D_2 linéaire+extraction image, algébrique, droite-point non 7 3DLMM_QLIN_2D quasi-linéaire+extraction image, Euclidienne, droite-point non 7 estimation linéaire ou quasi-linéaire d’une affinité, §8.5.2

AFF_LIN_3D linéaire 3D, algébrique, point-plan non 3

AFF_LIN_2D linéaire image, algébrique, point-droite non 3

AFF_QLIN_2D quasi-linéaire image, Euclidienne, point-droite non 3 3DLMM_AFF_LIN_3D linéaire+extraction 3D, algébrique, droite-droite non 4 estimation linéaire d’une similitude ou d’un mouvement rigide, §8.5.3

3DLMM_SIM_LIN_3D linéaire 3D, algébrique, droite-droite non 2 estimation non-linéaire, pour tout type de mouvement, §§8.4 et 8.6

NLIN_1 non-linéaire image, Euclidienne, droite-point non

-NLIN_2 non-linéaire image, Euclidienne, droite-point oui

-MLE non-linéaire image, Euclidienne, droite-point oui

-TAB. 8.2 – Résumé des méthodes proposées. La colonne “résolution” indique le type de résolution mis en œuvre (“extraction” signifie que la matrice de mouvement usuelle est extraite d’une matrice (6× 6) en général proche

d’une matrice de mouvement pour droites 3D), et la colonne “type d’erreur” résume les caractéristiques de la fonction de coût associée à la méthode (notons qu’une erreur “point-droite” est différente de “droite-point” : “point-droite” signifie une erreur mesurée entre des points prédits et des droites observées, et “droite-point” entre des droites prédites et des points mesurés). La colonne “sym.” indique si la méthode confère un rôle symétrique aux deux jeux d’images, et la colonne “# corresp.” donne le nombre de correspondances de droites minimum pour la méthode. Notons que seules les méthodes spécifiques à chaque espace sont mentionnées. Cela signifie que les méthodes proposées pour un certain espace peuvent être utilisées dans les espaces moins “généraux”, par exemple les méthodes d’estimation d’une homographie peuvent être utilisées dans les autres espaces, en extrayant de l’homographie estimée le mouvement du type désiré.

8.4. MAXIMUM DE VRAISEMBLANCE 183

autres méthodes : lorsque l’on conçoit une méthode sous-optimale linéaire ou non-linéaire, on porte un jugement a priori positif si la méthode induit une fonction de coût dont la forme est proche de celle du maximum de vraisemblance.

Pour définir algébriquement le maximum de vraisemblance, c’est à dire la fonction de coût, et sur quels paramètres doit être conduite l’optimisation, rappelons tout d’abord la formulation du maximum de vraisem-blance pour la reconstruction de droites et de caméras. Ce problème, étudié en §6.4, chapitre 6, est formulé par la minimisation de l’erreur de reprojection, sur les paramètres de la structure (c’est à dire des droites re-construites) S = {L₁, . . . ,Lm} et des caméras reconstruites M = {P₁, . . . ,P_n}. Les droites image observées

sont définies comme le meilleur ajustement à un ensemble de points. C’est sur la position de ces points que le bruit se manifeste, et c’est donc la somme des distances entre ces points et la droite reprojetée qui doit être minimisée. Cette somme de distances se réduit à la somme de distances entre la droite reprojetée et deux points particuliers, déterminés en fonction de tous les autres points, voir §3.3.2, chapitre 3. En notantˆlij les droites reprojetées (c’est à dire prédites par le modèle) etxijetyijles points image, l’erreur de reprojection est donnée par : L(S, M) = m j=1 L(Lj,M) = m j=1 n i=1 d²_{P H}(x_ij,ˆl_ij) + d²_{P H}(y_ij,ˆl_ij) . (8.1)

Dans le cas de l’estimation d’un mouvement, c’est l’erreur de reprojection dans les deux ensembles d’images qui doit être minimisée. On doit conduire l’optimisation sur le mouvement recherché et un ensemble de couples de droites 3D, exactement en correspondance par le mouvement. Si les positions des caméras ne sont pas parfaitement connues, elles peuvent être de même incluses dans la procédure d’optimisation. La fonction de coût est donnée par :

R(S, S_,M, M₎ ₌ L(S, M) + L(S_,M_), _(8.2) oùS et S_{sont les paramètres de la structure des deux reconstructions et}M et M_{les paramètres de chacun des} deux jeux de caméras. Cette fonction de coût dépend du mouvement 3D recherché car les droites reconstruites doivent être parfaitement en correspondance. En pratique, on conduira la minimisation sur les paramètres deS

et les paramètres du mouvement 3D. La structureS _{dans la deuxième base est alors donnée en appliquant le} mouvement àS. Si l’on note G les paramètres du mouvement, et G(S) son application à la structure S, alors,

la structure au maximum de vraisemblance est donnée par :

{ ˆS, ˆG} = arg min

S,G R(S, G(S), M, M).

8.4.2 Optimisation non-linéaire

Le problème du maximum de vraisemblance est résolu en pratique par une optimisation non-linéaire basée sur l’algorithme de Levenberg-Marquardt, décrit en §3.6.2, chapitre 3, initialisée avec la solution fournie par un algorithme linéaire ou quasi-linéaire. La représentation orthonormale des droites 3D, décrite en §6.4.2, chapitre 6, est utilisée pour paramétrer la structure S. Le mouvement 3D est paramétré par une matrice de mouvement

usuelle (4× 4) (la matrice de mouvement pour droites 3D correspondante est utilisée pour transférer les droites

(voir ci-dessous) ; cependant, il est plus pratique de paramétrer la matrice de mouvement usuelle puis de former la matrice de mouvement pour droites 3D, que d’estimer directement les coefficients de cette dernière). Cette paramétrisation est spécialisée au type de mouvement estimé, par exemple dans le cas d’un mouvement rigide, on utilise un vecteur-3 pour la translation et une matrice de SO(3) pour la rotation 3D, dont la mise à jour locale est effectuée avec 3 paramètres (les 3 angles d’Euler), comme décrit en §2.7.3, chapitre 2. La structure

S_{est déterminée par l’application du mouvement 3D à la structure}S. En pratique, on forme les coordonnées de

par la matrice de mouvement usuelle estimée, voir le chapitre 7, ce qui permet d’obtenir les coordonnées de Plücker des droites présentes dans la structure S_{. Les caméras sont paramétrées comme décrit en §3.5.5,} chapitre 3, c’est à dire que le repère de chaque reconstruction est centré sur la première caméra de chaque jeu. Les droites images prédites sont calculées en formant la matrice de projection (3× 6) pour coordonnées de

Plücker, voir §6.3.3, chapitre 6.

Dans le document Reconstruction et alignement en vision 3D : points, droites, plans et caméras (Page 193-197)