• Aucun résultat trouvé

Enveloppe visuelle ´ etendue ` a partir de cartes probabilistes de silhouettes

Chapitre 7 Estimation de l’enveloppe visuelle par fusion de cartes de sil-

7.2 Enveloppe visuelle ´ etendue ` a partir de cartes probabilistes de silhouettes

(a) (b) (c) (d)

Fig. 7.1 – L’image (a) repr´esente l’image d’une mod´elisation statistique de fond, observ´e par une cam´era fixe. L’image (b) repr´esente la trame courante observ´ee par cette mˆeme cam´era. L’image (c) repr´esente la carte de probabilit´e correspondante : la valeur de chaque pixel repr´esente sa probabilit´e de ne pas appartenir au fond (noir = 0, blanc = 1). L’image (d) indique l’estimation correspondante de ˜Si avec T = 0, 5.

Pour rendre les approches Shape-From-Silhouette plus robustes face aux probl`emes d’extrac-tion de silhouettes, nous proposons de d´ecider de l’appartenance d’un point 3D `a l’enveloppe visuelle ´etendue des objets d’int´erˆet, en se basant cette fois sur les cartes probabilistes de sil-houettes, plutˆot que sur l’information peu robuste des silhouettes ˜Si.

7.2 Enveloppe visuelle ´etendue `a partir de cartes probabilistes

de silhouettes

Rappelons la d´efinition de EVEm qui estime l’enveloppe visuelle ´etendue des objets d’int´erˆet observ´es par au moins m cam´eras :

D´efinition 17

EVEm={X : ˜S(X) = I(X) et Card(I(X)) ≥ m}



Supposons pour l’instant que le bruit N dans les cartes probabilistes de silhouettes est nul.

On en d´eduit ainsi

Soit M oyP (X) la contribution moyenne empirique de la probabilit´e que la projection de X appartienne au fond pour l’ensemble des cam´eras :

M oyP (X) = 1 Card(I(X))



i∈I(X)

Pi(Projπi(Q)) Ainsi on en d´eduit que :

∀X ∈ EVEm, M oyP (X) > T

Supposons d´esormais que le bruit N suit la loi normaleN (0; σ2). Nous d´efinissons de fa¸con similaire M oy ˜P (X), la contribution moyenne empirique de la probabilit´e estim´ee que la pro-jection de X appartienne au fond pour l’ensemble des cam´eras.

N suit une loi normale d’esp´erence 0, ainsi : ∀X ∈ EVEm, lim

Card(I(X))→∞M oy ˜P (X) = M oyP (X)

et

∀X ∈ EVEm, lim

Card(I(X))→∞M oy ˜P (X) > T (7.3)

Dans la mesure o`u la variable al´eatoire N suit la loi normaleN (0; σ2), on d´eduit la probabilit´e suivante :

P roba(N >−3σ) = P roba(N ≤ 3σ) ≈ 0, 999 Ainsi

P roba( ˜Pi(y) > Pi(y)− 3σ) ≈ 0, 999 Or ∀X ∈ EVEm,∀i ∈ I(X), Pi(X) > T

On en d´eduit que

∀X ∈ EVEm,∀i ∈ I(X), P roba( ˜Pi(X) > T − 3σ) > 0, 999 (7.4) En pr´esence d’un grand nombre de cam´eras, il provient des ´equations 7.3 et 7.4, que pour tout point X ∈ EVEm, le bruit dans les cartes de silhouette est compens´e et M oy ˜P (X) > T . Une tr`es grande majorit´e des points X∈ EVEm satisfont `a la propri´et´e ˜Pi(X) > T − 3σ. Ainsi nous venons de proposer plusieurs crit`eres qui permettent d’estimer EVEm `a partir des cartes de probabilit´e dont le bruit est suppos´e additif et suivant une loi normale d’esp´erance nulle.

D´efinition 18 Soit EVEm l’estimation de EVEm `a partir des cartes de probabilit´e de silhouette : 

EVEm ={X : ˜SE(X) =I(X), Card(I(X)) ≥ m et Moy ˜P (X) > T}

avec ˜SE(X) l’ensemble estim´e des indices de silhouettes, dans lesquelles X poss`ede une image. ˜

SE(X) ={i ∈ I(X) : ˜Pi(X) > T − 3σ}

7.2. Enveloppe visuelle ´etendue `a partir de cartes probabilistes de silhouettes

Fig. 7.2 – L’image de gauche repr´esente en 2D les valeurs de Moy ˜P (X). Le noir correspond `a une valeur de 0 et le blanc correspond `a une valeur de 1. L’image de droite repr´esente le r´esultat de EVEm avec T = 0, 7 et σ = 0, 13.

L’approche que nous venons de proposer permet pour chaque point 3D, de compenser l’informa-tion de probabilit´e erron´ee suppos´ee minoritaire, par la contribution majoritairement observ´ee. De plus le fait d’imposer un seuil minimum permet de pr´evenir les erreurs issues de valeurs extrˆemes.

Afin de profiter du sch´ema de confrontation permettant de d´ecider de l’appartenance d’un point 3D X `a EVEm, il est pr´ef´erable qu’il y ait au moins deux informations `a confronter ; c’est `a dire que m≥ 2. Le param`etre T indique une valeur de confiance, d´efinissant la pr´ecision moyenne de l’estimation de EVEm. Le param`etre σ r´egit la dispersion maximale autoris´ee. Il participe `a la d´efinition du seuil bas, en dessous duquel la probabilit´e qu’un point 2D n’appartienne pas au fond est jug´ee trop faible. La figure 7.2 montre une repr´esentation 2D des valeurs de M oy ˜P (X) (image de gauche) ainsi que la reconstruction EVEm correspondante. L’algorithme 5 pr´esente une m´ethode pour estimer EVEm par un ensemble de voxels.

Il n’est `a priori pas facile de d´eterminer le couple de param`etres (T, σ) qui offre la meilleure qualit´e de reconstruction. Nous reviendrons sur cette difficult´e chapitre 8, dans lequel nous r´ ea-lisons une analyse qualitative de cette approche `a partir de donn´ees simul´ees.

Outre le fait que notre approche estime EVEm et Shape-From-Silhouette (qui en est un cas particulier) de fa¸con robuste en pr´esence d’extraction de silhouettes bruit´ees, elle permet de calculer les silhouettes binaires corrig´ees des objets d’int´erˆet. En effet, le fait de confronter en 3D l’information des cartes de probabilit´e apporte une m´ecanisme de confrontation plus robuste que les approches monoculaires classiques. Soit ˜SiC la silhouette binaire corrig´ee de la cam´era Ci :

˜

Diviser l’espace d’int´erˆet en G× G × G voxels vk avec k∈ [1, · · · , G3] ; Pour k de 1 `a G3faire vk ← Dehors ; ˜ SConf(vk)← ∅ ; I(vk)← ∅ ; M oy ˜P (vk)← 0 ; Pour i de 1 `a n faire Si ( (Projπi(vk))∩ Ii = ∅ ) Alors I(vk)← I(vk)∪ i ; M oy ˜P (vk)← Moy ˜P (vk) + ˜Pi(Projπi(vk)) ; Si ( ˜Pi(Projπi(vk)) > T− 3σ ) Alors ˜ SConf(vk)← ˜SConf(vk)∪ i ; Fin Si Fin Si Fin Pour M oy ˜P (vk)← Moy ˜P (vk)/Card(I(vk)) ;

Si ( ˜SConf(vk) =I(vk) et Card(I(vk))≥ m et Moy ˜P (vk) > T ) Alors vk ← Dedans ;

Fin Si Fin Pour



EVEmest approxim´ee par l’union des voxels vk ´etiquet´es Dedans ;

Algorithme 5: Algorithme d’estimation de EVEm `a base de voxels.

Dans la suite nous pr´esentons les r´esultats de l’approche EVEm `a partir de donn´ees r´eelles, ainsi que la capacit´e de correction de silhouette propos´ee par cette approche.

7.3 esultats

Nous allons illustrer `a travers plusieurs exp´erimentations le fait que EVEm est plus robuste aux extractions de silhouettes erron´ees que l’approche EVEm.

Ces exp´erimentations ont ´et´e r´ealis´ees pour une sc`ene film´ee par six cam´eras qui fournissent 30 images par seconde d’une r´esolution de 640×480 pixels. Le calcul de EVEmest r´ealis´e sur un seul ordinateur avec un processeur AMD 5600+ X2 et une carte graphique NVIDIA GTX7900. L’espace 3D de 2m× 2m × 2m est estim´e par une grille de voxels de r´esolution 128 × 128 × 128. La figure 7.3 confronte les r´esultats issus de l’approche EVEm par rapport `a l’approche EVEm. La configuration pr´esent´ee g´en`ere beaucoup de faux-n´egatifs dans les images binaires de silhouettes. Ainsi EVEm n’est pas capable d’estimer correctement l’enveloppe visuelle ´etendue de l’objet d’int´erˆet (voir figures 7.3(a) et 7.3(c)).

7.3. R´esultats

(a) (b)

(c) (d)

Fig. 7.3 – Reconstructions EVE4compar´ees aux reconstructions propos´ees par EVE4. Les images (a) et (c) repr´esentent le r´esultat de EVE4 `a partir des silhouettes observ´ees ˜Si, binaris´ees avec T = 0, 5. Le bruit pr´esent dans les silhouettes ˜Si implique que le reconstruction EVE4 soit incompl`ete. Les images 7.3(b) et 7.3(d) repr´esentent les reconstruction des mˆemes sc`enes par l’approche EVE4, avec T = 0, 5 et σ = 0, 13. Cette reconstruction est robuste `a l’information de silhouette bruit´ee.

Dans la figure 7.3(b), EVEm reconstruit une grande partie de l’objet d’int´erˆet, mais la quan-tit´e de bruit est trop importante pour que la forme 3D compl`ete soit estim´ee. Cependant dans la figure 7.3(d), EVEm estime la totalit´e de l’objet d’int´erˆet.

Comme nous l’avons soulign´e pr´ec´edemment l’approche EVEm peut ˆetre utilis´ee pour cor-riger les cartes binaires de silhouettes. La figure 7.4 pr´esente le r´esultat de ce processus de correction, pour la configuration pr´esent´ee figures 7.3(c) et 7.3(d). Les silhouettes estim´ees par l’´etiquetage monoculaire sont repr´esent´ees sur la composante rouge de l’image. La correction est elle repr´esent´ee sur la composante bleue. Nous observons que EVEm permet de corriger le plu-part des points d´etect´es faux-n´egatifs ou faux-positifs par l’approche monoculaire. Les grandes zones rouges (au sol) ne sont pas coh´erentes depuis tous les points de vue et n’appartiennent

Fig. 7.4 – Illustration de la correction de silhouettes permise par l’approche EVEm. Les sil-houettes observ´ees proviennent de la sc`ene pr´esent´ee figure 7.3(d). La composante rouge re-pr´esente les silhouettes ˜Si extraites de fa¸con monoculaire. Les silhouettes ˜SiC corrig´ees sont repr´esent´ee sur la composante bleue de l’image. On observe la pr´esence d’un liserai bleu autour de toutes les silhouettes. Celui-ci provient d’une r´esolution de la grille de voxel trop grossi`ere. Enfin certaines zones de silhouettes ”monoculaires” ˜Si ne sont pas recouvertes par les silhouettes corrig´ees ˜SiC. Les grandes zones rouges proviennent du reflet des ´eclairages de la sc`ene sur le sol. N’´etant pas coh´erentes, ces parties ne sont pas repr´esent´ees dans les silhouettes corrig´ees

˜

SiC. Enfin certaines erreurs de calibrage sont `a l’origine de petites zones des silhouettes ˜Si qui n’appartienne pas `a ˜SiC.

donc pas aux silhouettes corrig´ees. Enfin l’apparition d’un liserai bleu autour des silhouettes ˜

Si provient de l’estimation de l’EVEm par un ensemble de voxels dont la r´esolution n’est pas suffisamment fine.

Comme pour la m´ethode EVEm, nous avons implant´e EVEmsur carte graphique. L’ensemble des op´erations de calcul de la contribution moyenne empirique est r´ealis´e par un fragment shader. Nous obtenons des temps de calculs similaires `a l’approche EVEm. En effet la partie limitante de l’algorithme provient du transfert des voxels calcul´es sur la carte graphique vers la m´emoire centrale de l’ordinateur. Pour une grille de dimension 2m× 2m × 2m de r´esolution 1283, notre approche est capable de calculer plus de 100 reconstructions par seconde.

7.4. Discussion

7.4 Discussion

Une tr`es grande partie des m´ethodes qui estiment la forme 3D d’objets 3D `a partir de sil-houettes sont peu robustes aux silsil-houettes mal extraites. Dans ce chapitre noue avons propos´e une approche pragmatique qui rend les m´ethodes EVEm plus robustes. Notre contribution im-pose seulement quelques calculs suppl´ementaires par rapport `a l’approche Shape-From-Silhouette ou encore sa g´en´eralisation EVEm. Ainsi cette m´ethode fonctionne toujours en temps r´eel et per-met, pour une grille de voxel de 1283´el´ements, d’estimer plus de 100 formes par seconde. Notre contribution peut-ˆetre compar´ee `a l’approche propos´ee par Franco et Boyer dans [FB05]. Ces approchent tentent de r´epondent `a une mˆeme probl´ematique. Notre approche, propose en temps r´eel, des r´esultats semblables `a ceux propos´es par leur approche, n´ecessitant environ 10 secondes de calcul par trame. Nous ne pensons pas que le fait de porter leur algorithme sur carte gra-phique programmable permettra un gain de l’ordre de trois d´ecades.

Grˆace `a cette contribution simple, nous rendons les m´ethodes Shape-From-Silhouette ou en-core EVEm aptes `a des conditions exp´erimentales plus difficiles, toujours en temps r´eel.

Dans la section suivante nous pr´esentons une ´evaluation du processus complet d’estimation 3D temps r´eel `a partir de plusieurs vue sans contraintes de placement de cam´eras, robuste aux extractions erron´ees de silhouette et qui ne g´en`ere pas d’objets fantˆomes.