• Aucun résultat trouvé

A l’exception de situations d´eg´en´er´ees (surfaces critiques, plusieurs solutions pour des donn´ees mini-males, cam´era stationnaire), il existe une seule famille de solutions satisfaisant l’´equation (5.1). Elles sont reli´ees entre elles par des transformations projectives : sif(P

i

)

mi

=1

;

(Q

p

)

np

=1

gest une reconstruc-tion projective, alors, pour toute transformareconstruc-tion projective non singuli`ere T, l’ensemble

f(P

i

T ,1

)

mi

=1

;

(TQ

p

)

np

=1

gen est aussi une.

En pr´esence de bruit affectant la position des points image, une solution exacte n’est normalement pas possible et il faut d´efinir un crit`ere selon lequel on peut d´eterminer une reconstruction optimale. Le crit`ere g´en´eralement admis est la minimisation de la somme des carr´es des distances entre les points reprojet´es et ceux mesur´es. Il s’agit du crit`ere de maximum de vraisemblance sous hypoth`ese d’un bruit gaussien (voir 3.7). L’utilisation de ce crit`ere engendre une formulation non lin´eaire de la fonction de coˆut `a minimiser et l’estimation se fait avec des algorithmes num´eriques ad´equates. Il s’agit d’une m´ethode standard, introduite par Mohr et al. [129, 130], qui est la sp´ecialisation de l’ajustement de faisceaux au cas non calibr´e. Le probl`eme habituel des m´ethodes d’optimisation non lin´eaire est le besoin d’une bonne initialisation des param`etres. La recherche se concentre donc sur le d´eveloppement de m´ethodes ne n´ecessitant pas une telle initialisation, qui sont sous-optimales mais qui fournissent un bon point de d´epart pour une ´eventuelle phase d’optimisation.

Nous proposons dans la suite une m´ethode de reconstruction projective qui prend en compte simultan´ement toutes les donn´ees et qui ne s’appuie pas sur une pr´ef´erence de quelques vues ou points pour fixer le rep`ere projectif de reconstruction.

5.3 Reconstruction par factorisation

5.3.1 Cam´eras affines

La reconstruction 3D par factorisation a ´et´e introduite par Tomasi et Kanade, dans le cas d’une s´e-quence d’images orthographiques [202] (voir aussi l’approche contemporaine de Debrunner et Ahuja [43]). Le principe de leur m´ethode est tr`es simple ; consid´erons l’´equation de projection r´eduite d’une cam´era affine (cf. 2.2.3.1) :  q

ip

1  =  P

i

0 0 T 1  Q

p

1 

;

o`uq

ip

etQ

p

sont les coordonn´ees non homog`enes des points image et 3D respectivement2, etP

i

est une matrice de projection de dimension23. On peut regrouper les projections de

n

points dans

m

vues dans une seule grande ´equation matricielle :

W 0 B B B @ q 11 q 12  q 1

n

q 21 q 22  q 2

n

.. . ... . .. ... q

m

1 q

m

2  q

mn

1 C C C A 2

m



n

= 0 B B B @ P 1 P 2 .. . P

m

1 C C C A 2

m

3 , Q 1 Q 2  Q

n

 3

n :

2. Afin d’obtenir l’´equation de projection r´eduite, les points dans chaque image et les points 3D doivent ˆetre transform´es tels que leurs centres de gravit´e se trouvent `a l’origine des rep`eres correspondants.

5.3. RECONSTRUCTION PAR FACTORISATION 79

La matrice W est appel´ee la matrice des mesures parce qu’elle contient toutes les donn´ees – les coordonn´ees des points image.West le produit de la matrice de projection composite et de la matrice de structure composite, toutes deux de rang au plus 3 (ayant seulement 3 colonnes ou 3 lignes). Par cons´equent,West aussi de rang au plus 3. C’est l’observation cl´e pour la m´ethode de reconstruction propos´ee. Consid´erons une d´ecomposition en valeurs singuli`eres deW:

W=U

2

m



n



n



n

V T

n



n

;

o`uest la matrice diagonale des valeurs singuli`eres dont au plus 3 sont non nulles. Si l’on recompose

W par multiplication des matrices du cˆot´e droit de l’´equation pr´ec´edente, il y a donc seulement 3 colonnes deUet 3 lignes deV

T

qui interviennent dans les calculs (voir aussi la figure 5.1). Soient

U 0

etV 0

T

les matrices compos´ees de ces colonnes ou lignes et 0

la matrice diagonale des 3 valeurs singuli`eres non nulles. On observe alors l’´egalit´e suivante :

W=U 0 2

m

3  0 33 V 0 T 3

n

: Soit  0 =  00  000

une d´ecomposition quelconque de  0

. Alors, avec les matrices U 00 = U 0  00 et V 00 T = 000 V 0 T , nous avons : W=U 00 2

m

3 V 00 T 3

n

:

Cette ´equation signifie queU 00

etV 00T

constituent une reconstruction admissible de la sc`ene :U 00

joue le rˆole de matrice de projection composite etV

00 T

celui de matrice de structure composite. Cette interpr´etation est admissible puisque la reprojection des points 3D reproduit les points image (qui sont contenus dans W). La reconstruction n’est qu’affine puisque, pour toute transformation T

33 non singuli`ere,U 00 T ,1 etTV 00 T

interpr`etent aussi bien les donn´ees.

W U U’ V’T

0

s1 2 s 3 s = = = = SVD VT

FIG. 5.1: Principe de la factorisation. La matriceWest de rang 3 ce qui se manifeste par l’existence de seulement trois valeurs singuli`eres non nulles (s

1 ;s

2ets

3). Les parties ombr´ees des matricesU;

etV T

sont donc((inutiles )).

Jusqu’ici nous n’avons pas parl´e de bruit dans les coordonn´ees image. En pr´esence de bruit, la matrice des mesures ne sera plus de rang 3, mais g´en´eralement de rang plein. Pour combattre le bruit, on d´etermine alors une matrice b

Wde rang 3 qui approche bien la matrice des mesuresW. Ensuite on peut factoriser b

Wcomme d´ecrit ci-dessus. En pratique, la d´etermination de b

Wet sa factorisation se font en une seule ´etape : on effectue une d´ecomposition en valeurs singuli`eres deW et on annule toutes les valeurs singuli`eres sauf les trois plus grandes. On retient seulement les colonnes et lignes de U et V

T

singuli`eres. Si l’on multiplie les matricesU 00

etV 00

T

obtenues, on obtient la matrice b

Wde rang 3, qui approche au mieuxW, au sens de la norme spectrale [68] et mˆeme de la norme de Frobenius [168] :

b W= argmin W 0

;

rang(W 0 )=3 jjW,W 0 jj

F :

Ce constat signifie que la reconstructionf(P

i

)

;

(Q

p

)gobtenue en factorisantW, est optimale, au sens du crit`ere des erreurs de reprojection (voir la section 3.7), puisquejjW,

b W jj

F

= P

i;pd

(q

ip;

P

i

Q

p

) 2 . 5.3.2 Cam´eras perspectives

Nous consid´erons maintenant le cas des cam´eras perspectives, o`u l’´equation de projection prend la forme :

ip

q

ip

=P

i

Q

p :

Contrairement au cas affine, nous ne pouvons pas ´eliminer les facteurs d’´echelle

ip

. En pratique, les points extraits d’une image sont donn´es en coordonn´ees non homog`enes, c’est-`a-dire implicite-ment multipli´ees avec un scalaire tel que la troisi`eme coordonn´ee est ´egale `a 1; donc, le (( vrai ))

facteur d’´echelle n’est pas mesurable. Nous allons appeler les facteurs d’´echelle inconnus

ip

les profondeurs projectives3. Ce nom a ´et´e choisi parce que ces facteurs contiennent toute l’informa-tion n´ecessaire pour la reconstrucl’informa-tion projective. Leur d´eterminal’informa-tion est en effet ´equivalente `a une reconstruction projective dans le formalisme de l’image composite [207, 208].

Les profondeurs projectives sont li´ees aux ((vraies))profondeurs comme suit. SiQ

p

etq

ip

sont repr´esent´es en coordonn´ees ´etendues (1comme derni`ere coordonn´ee) et siP

i

est normalis´ee tel que le sous-vecteur(P

i

31

;

P

i

32

;

P

i

33

)est unitaire, alors la profondeur projective

ip

est la vraie profondeur deQ

p

, c’est-`a-dire sa distance du plan focal de la cam´era.

L’ensemble des ´equations de projection peuvent ˆetre regroup´ees en une seule ´equation matricielle de dimension3

m



n

: W 0 B B B @



11 q 11



12 q 12 



1

n

q 1

n



21 q 21



22 q 22 



2

n

q 2

n

.. . ... . .. ...

m

1 q

m

1

m

2 q

m

2 

mn

q

mn

1 C C C A 3

m



n

= 0 B B B @ P 1 P 2 .. . P

m

1 C C C A 3

m

4 , Q 1 Q 2  Q

n

 4

n :

(5.2) En analogie au cas affine, nous appelonsWla matrice des mesures, bien qu’elle contienne les fac-teurs d’´echelle

ip

qui ne sont pas mesur´es. Il est clair queWest de rang au plus 4. Ceci n’est pourtant vrai que si les profondeurs projectives correctes sont utilis´ees. Malheureusement, les

ip

sont perdues lors de la projection et regrouper les coordonn´ees image ´etendues (1comme 3e coordonn´ee) r´esulte en une matriceWqui est g´en´eralement de rang plein et ne permet pas sa factorisation en mouvement et structure.

Si nous ´etions capables de d´eterminer les profondeurs projectives correctes, nous pourrions cons-truire une matrice des mesures avec des coordonn´ees image correctement ´echelonn´ees, qui sera de rang 4. Ensuite, la structure 3D de la sc`ene et le calibrage projectif des cam´eras peuvent ˆetre d´eter-min´es par le mˆeme sch´ema de factorisation que pour la cam´era affine. Dans le cas pr´esent, on obtient

3. Cette d´esignation n’a pas le mˆeme sens que les((profondeurs projectives))de Shashua, qui sont des birapports le long de rayons de projection [174].