A l’exception de situations d´eg´en´er´ees (surfaces critiques, plusieurs solutions pour des donn´ees mini-males, cam´era stationnaire), il existe une seule famille de solutions satisfaisant l’´equation (5.1). Elles sont reli´ees entre elles par des transformations projectives : sif(P
i
)mi
=1;
(Qp
)np
=1gest une reconstruc-tion projective, alors, pour toute transformareconstruc-tion projective non singuli`ere T, l’ensemble
f(P
i
T ,1)
mi
=1;
(TQp
)np
=1gen est aussi une.
En pr´esence de bruit affectant la position des points image, une solution exacte n’est normalement pas possible et il faut d´efinir un crit`ere selon lequel on peut d´eterminer une reconstruction optimale. Le crit`ere g´en´eralement admis est la minimisation de la somme des carr´es des distances entre les points reprojet´es et ceux mesur´es. Il s’agit du crit`ere de maximum de vraisemblance sous hypoth`ese d’un bruit gaussien (voir 3.7). L’utilisation de ce crit`ere engendre une formulation non lin´eaire de la fonction de coˆut `a minimiser et l’estimation se fait avec des algorithmes num´eriques ad´equates. Il s’agit d’une m´ethode standard, introduite par Mohr et al. [129, 130], qui est la sp´ecialisation de l’ajustement de faisceaux au cas non calibr´e. Le probl`eme habituel des m´ethodes d’optimisation non lin´eaire est le besoin d’une bonne initialisation des param`etres. La recherche se concentre donc sur le d´eveloppement de m´ethodes ne n´ecessitant pas une telle initialisation, qui sont sous-optimales mais qui fournissent un bon point de d´epart pour une ´eventuelle phase d’optimisation.
Nous proposons dans la suite une m´ethode de reconstruction projective qui prend en compte simultan´ement toutes les donn´ees et qui ne s’appuie pas sur une pr´ef´erence de quelques vues ou points pour fixer le rep`ere projectif de reconstruction.
5.3 Reconstruction par factorisation
5.3.1 Cam´eras affines
La reconstruction 3D par factorisation a ´et´e introduite par Tomasi et Kanade, dans le cas d’une s´e-quence d’images orthographiques [202] (voir aussi l’approche contemporaine de Debrunner et Ahuja [43]). Le principe de leur m´ethode est tr`es simple ; consid´erons l’´equation de projection r´eduite d’une cam´era affine (cf. 2.2.3.1) : q
ip
1 = Pi
0 0 T 1 Qp
1;
o`uq
ip
etQp
sont les coordonn´ees non homog`enes des points image et 3D respectivement2, etPi
est une matrice de projection de dimension23. On peut regrouper les projections den
points dansm
vues dans une seule grande ´equation matricielle :W 0 B B B @ q 11 q 12 q 1
n
q 21 q 22 q 2n
.. . ... . .. ... qm
1 qm
2 qmn
1 C C C A 2m
n
= 0 B B B @ P 1 P 2 .. . Pm
1 C C C A 2m
3 , Q 1 Q 2 Qn
3n :
2. Afin d’obtenir l’´equation de projection r´eduite, les points dans chaque image et les points 3D doivent ˆetre transform´es tels que leurs centres de gravit´e se trouvent `a l’origine des rep`eres correspondants.
5.3. RECONSTRUCTION PAR FACTORISATION 79
La matrice W est appel´ee la matrice des mesures parce qu’elle contient toutes les donn´ees – les coordonn´ees des points image.West le produit de la matrice de projection composite et de la matrice de structure composite, toutes deux de rang au plus 3 (ayant seulement 3 colonnes ou 3 lignes). Par cons´equent,West aussi de rang au plus 3. C’est l’observation cl´e pour la m´ethode de reconstruction propos´ee. Consid´erons une d´ecomposition en valeurs singuli`eres deW:
W=U
2
m
n
n
n
V Tn
n
;o`uest la matrice diagonale des valeurs singuli`eres dont au plus 3 sont non nulles. Si l’on recompose
W par multiplication des matrices du cˆot´e droit de l’´equation pr´ec´edente, il y a donc seulement 3 colonnes deUet 3 lignes deV
T
qui interviennent dans les calculs (voir aussi la figure 5.1). Soient
U 0
etV 0
T
les matrices compos´ees de ces colonnes ou lignes et 0
la matrice diagonale des 3 valeurs singuli`eres non nulles. On observe alors l’´egalit´e suivante :
W=U 0 2
m
3 0 33 V 0 T 3n
: Soit 0 = 00 000une d´ecomposition quelconque de 0
. Alors, avec les matrices U 00 = U 0 00 et V 00 T = 000 V 0 T , nous avons : W=U 00 2
m
3 V 00 T 3n
:Cette ´equation signifie queU 00
etV 00T
constituent une reconstruction admissible de la sc`ene :U 00
joue le rˆole de matrice de projection composite etV
00 T
celui de matrice de structure composite. Cette interpr´etation est admissible puisque la reprojection des points 3D reproduit les points image (qui sont contenus dans W). La reconstruction n’est qu’affine puisque, pour toute transformation T
33 non singuli`ere,U 00 T ,1 etTV 00 T
interpr`etent aussi bien les donn´ees.
W U U’ ’ V’T
0
s1 2 s 3 s = = = = SVD VTFIG. 5.1: Principe de la factorisation. La matriceWest de rang 3 ce qui se manifeste par l’existence de seulement trois valeurs singuli`eres non nulles (s
1 ;s
2ets
3). Les parties ombr´ees des matricesU;
etV T
sont donc((inutiles )).
Jusqu’ici nous n’avons pas parl´e de bruit dans les coordonn´ees image. En pr´esence de bruit, la matrice des mesures ne sera plus de rang 3, mais g´en´eralement de rang plein. Pour combattre le bruit, on d´etermine alors une matrice b
Wde rang 3 qui approche bien la matrice des mesuresW. Ensuite on peut factoriser b
Wcomme d´ecrit ci-dessus. En pratique, la d´etermination de b
Wet sa factorisation se font en une seule ´etape : on effectue une d´ecomposition en valeurs singuli`eres deW et on annule toutes les valeurs singuli`eres sauf les trois plus grandes. On retient seulement les colonnes et lignes de U et V
T
singuli`eres. Si l’on multiplie les matricesU 00
etV 00
T
obtenues, on obtient la matrice b
Wde rang 3, qui approche au mieuxW, au sens de la norme spectrale [68] et mˆeme de la norme de Frobenius [168] :
b W= argmin W 0
;
rang(W 0 )=3 jjW,W 0 jjF :
Ce constat signifie que la reconstructionf(P
i
);
(Qp
)gobtenue en factorisantW, est optimale, au sens du crit`ere des erreurs de reprojection (voir la section 3.7), puisquejjW,b W jj
F
= Pi;pd
(qip;
Pi
Qp
) 2 . 5.3.2 Cam´eras perspectivesNous consid´erons maintenant le cas des cam´eras perspectives, o`u l’´equation de projection prend la forme :
ip
qip
=Pi
Qp :
Contrairement au cas affine, nous ne pouvons pas ´eliminer les facteurs d’´echelle
ip
. En pratique, les points extraits d’une image sont donn´es en coordonn´ees non homog`enes, c’est-`a-dire implicite-ment multipli´ees avec un scalaire tel que la troisi`eme coordonn´ee est ´egale `a 1; donc, le (( vrai ))facteur d’´echelle n’est pas mesurable. Nous allons appeler les facteurs d’´echelle inconnus
ip
les profondeurs projectives3. Ce nom a ´et´e choisi parce que ces facteurs contiennent toute l’informa-tion n´ecessaire pour la reconstrucl’informa-tion projective. Leur d´eterminal’informa-tion est en effet ´equivalente `a une reconstruction projective dans le formalisme de l’image composite [207, 208].Les profondeurs projectives sont li´ees aux ((vraies))profondeurs comme suit. SiQ
p
etqip
sont repr´esent´es en coordonn´ees ´etendues (1comme derni`ere coordonn´ee) et siPi
est normalis´ee tel que le sous-vecteur(Pi
31;
Pi
32;
Pi
33)est unitaire, alors la profondeur projective
ip
est la vraie profondeur deQp
, c’est-`a-dire sa distance du plan focal de la cam´era.L’ensemble des ´equations de projection peuvent ˆetre regroup´ees en une seule ´equation matricielle de dimension3
m
n
: W 0 B B B @ 11 q 11 12 q 12 1n
q 1n
21 q 21 22 q 22 2n
q 2n
.. . ... . .. ...m
1 qm
1m
2 qm
2mn
qmn
1 C C C A 3m
n
= 0 B B B @ P 1 P 2 .. . Pm
1 C C C A 3m
4 , Q 1 Q 2 Qn
4n :
(5.2) En analogie au cas affine, nous appelonsWla matrice des mesures, bien qu’elle contienne les fac-teurs d’´echelleip
qui ne sont pas mesur´es. Il est clair queWest de rang au plus 4. Ceci n’est pourtant vrai que si les profondeurs projectives correctes sont utilis´ees. Malheureusement, lesip
sont perdues lors de la projection et regrouper les coordonn´ees image ´etendues (1comme 3e coordonn´ee) r´esulte en une matriceWqui est g´en´eralement de rang plein et ne permet pas sa factorisation en mouvement et structure.Si nous ´etions capables de d´eterminer les profondeurs projectives correctes, nous pourrions cons-truire une matrice des mesures avec des coordonn´ees image correctement ´echelonn´ees, qui sera de rang 4. Ensuite, la structure 3D de la sc`ene et le calibrage projectif des cam´eras peuvent ˆetre d´eter-min´es par le mˆeme sch´ema de factorisation que pour la cam´era affine. Dans le cas pr´esent, on obtient
3. Cette d´esignation n’a pas le mˆeme sens que les((profondeurs projectives))de Shashua, qui sont des birapports le long de rayons de projection [174].