• Aucun résultat trouvé

D´efinition d’une couche

Dans le document The DART-Europe E-theses Portal (Page 29-34)

1.2 Etat de l’art´ . . . 27 1.2.1 Il ´etait une fois ... . . 27 1.2.2 Une premi`ere formalisation probabiliste . . . 28 1.2.3 Vers une meilleure estimation du mouvement . . . 28 1.2.4 Autres approches de segmentation via le mouvement . . . 30 1.2.5 Les champs de Markov . . . 30 1.5.2 Initialisation - d´etermination du nombre de couches . . . 35

1.1 D´ efinition d’une couche

Toutes les techniques d’extraction de couches s’appuient sur la mˆeme d´efinition d’une couche. La d´efinition formelle est d’abord pr´esent´ee avant d’expliciter le choix d’une telle repr´esentation.

On note la ie couche li ∈ L que l’on d´efinit par : – un support : r´egion de l’image not´ee Si;

– un mouvement param´etrique not´eTi, g´en´eralementaffine ouprojectif.

o`uL est l’ensemble des couches constituant la s´equence vid´eo de sorte que l’ensemble des r´egions Si forme une partition de chaque image. Pour n couches consid´er´ees, on a ainsi :

[n i=1

Si = Ω et Si∩Sj =∅, i6=j (1.1) o`u Ω est le domaine de l’image consid´er´ee. D´efinissons les deux principaux types de mou-vement param´etrique sur laquelle repose la notion de couche : le moumou-vement projectif et le mouvement affine.

Mouvement projectif

Un mod`ele de mouvement T dit projectif est une mod´elisation param´etrique `a huit param`etres (h1, h2· · ·h8) du mouvement d´efinissant la transformation T : Ωt 7→t+1 permettant de passer du pixel x au pixel x0. En coordonn´ees homog`enes, nous avons x= (u, v, w)T etx0 = (u0, v0, w0)T et la transformation x0 =T(x) s’´ecrit alors :

Chap. 1. Segmentation en couches

Ce mod`ele repr´esente le mouvement entre deux projections d’un mˆeme plan 3D sur les plans de deux images. Un tel mouvement est aussi appel´e une homographie [100]. Ainsi, tous les pixels d’un mˆeme plan 3D suivent un mˆeme mouvement param´etrique projectif et la classification en couches a alors pour but d’extraire l’ensemble des plans 3D composant une sc`ene `a partir de l’analyse de leurs mouvements. Le mod`ele projectif englobe aussi tous les mouvements d’ordre affine.

Mouvement affine

Le mod`ele affine est une version simplifi´ee du mod`ele projectif. Il est d´efini par six param`etres (a1· · ·a6) d´efinissant le mouvement T entre le pixel x = (u, v)T et x0 = Il permet de repr´esenter les mouvements de translation, de rotation, d’expansion et de contraction (figure 1.1). Il est souvent utilis´e en analyse du mouvement car c’est un ex-cellent compromis entre complexit´e du mod`ele et simplicit´e d’estimation. Il permet de repr´esenter correctement la quasi-totalit´e des mouvements que l’on peut rencontrer dans une s´equence vid´eo [15, 70] : d´eplacement des plans et des objets, d´eplacement et zoom de la cam´era, etc.

Figure 1.1 – Flots optiques mod´elis´es par trois mod`eles affines diff´erents : `a gauche, expansion autour de l’origine (∀ i, ai = 0 sauf a2 = 1 et a6 = 1), au milieu, rotation autour de l’origine (a1 = a4 = 0, a2 = a6 = cosθ et a3 = −a5 = sinθ), `a droite, translation (∀ i, ai = 0 sauf a1 =vx).

Nous donnons d’abord quelques exemples de repr´esentations en couches avant de jus-tifier le choix d’une telle repr´esentation.

1.1.1 Exemples de d´ ecomposition en couches

La figure 1.2 illustre un exemple de repr´esentation en couches : il y a ici 3 couches, 1) l’arri`ere-plan, 2) la voiture noire et 3) la voiture grise. Chaque couche a sa propre profondeur et son propre mouvement projectif, exception faite pour les roues des voitures (qui ont leur propre mouvement de rotation) et pour le l´eger mouvement des arbres (dˆu

23

Sec. 1.1. D´efinition d’une couche au vent) qui sont assimil´es `a l’une des 3 couches correspondantes du fait d’une certaine tol´erance fix´ee par l’utilisateur ou le contexte1.

Figure 1.2 – Exemple de d´ecomposition en couches : `a gauche, l’image originale extraite d’une s´equence vid´eo, `a droite sa d´ecomposition en couches. Il y a ici 3 couches : 1) l’arri`ere-plan, 2) la voiture noire et 3) la voiture grise. Chaque r´egion a son propre mouvement param´etrique (projectif ici).

La figure1.3 montre un autre exemple de d´ecomposition en couches o`u chaque couche correspond r´eellement `a des plans 3D distincts.

Figure 1.3 – Exemple de d´ecomposition en couches : `a gauche, l’image originale extraite d’une s´equence vid´eo, `a droite sa d´ecomposition en couches. Il y a ici 4 couches : 1) plan de la table (qui inclut le papier pos´e dessus), 2 et 3) plans de la boˆıte et 4) jaquette du cd-rom. Chaque couche repr´esente un plan 3D.

1.1.2 Pourquoi une telle repr´ esentation ?

Le choix d’une telle repr´esentation est guid´e d’une part par l’application souhait´ee, ici la segmentation `a partir du mouvement, d’autre part pour r´esoudre certaines difficult´es techniques propres aux m´ethodes d’analyse du mouvement qui s’appuient notamment sur le flot optique [103,139,30].

1Ce point est vu et discut´e en d´etail tout au long de ce m´emoire.

Chap. 1. Segmentation en couches

Motivation conceptuelle

En consid´erant les mouvements param´etriques projectifs (ou leurs approximations af-fines), la segmentation en couches permet de distinguer l’ensemble des plans 3D d’une sc`ene et l’ensemble des objets poss´edant un mouvement propre (d’ordre projectif). Si l’on consid`ere l’exemple d’une sc`ene urbaine, cette derni`ere est constitu´ee des plans de la chauss´ee, des fa¸cades et des rang´ees d’arbres et de l’ensemble des objets ayant un mou-vement propre comme les voitures ou les pi´etons. La repr´esentation en couches est ainsi pertinente dans le cadre urbain qui regorge de plans 3D (fa¸cades, chauss´ee) et d’objets en mouvement (assimilables en terme de mouvement `a des plans 3D).

Il faut alors pr´eciser dans quelle proportion pouvons-nous consid´erer comme planaire un ensemble de pixels ou d’objets. Aussi, selon la tol´erance fix´ee, la repr´esentation en couches a une finalit´e diff´erente. On peut notamment distinguer les quatre cas possibles suivants qui sont autant de fa¸cons d’aborder la repr´esentation en couches (voir la fi-gure 1.4) :

1. une et une seule couche pour toute la sc`ene : i.e. on consid`ere que toute la sc`ene est planaire ou, de fa¸con ´equivalente, que la cam´era effectue un mouvement de rotation sur elle-mˆeme dans une sc`ene fixe. Nous sommes alors dans le cas de la cr´eation de panoramas [151] ;

2. une couche par pixel : on rejoint ici la formulation du flot optique [29] ;

3. n couches : segmentation via le mouvement. Il faut alors d´efinir la notion de plan et la«marge d’erreur»que l’on souhaite retenir [136, 99] ;

4. une couche par disparit´e dans le cadre de la reconstruction tridimensionnelle, par st´er´eovision par exemple, d’une sc`ene statique [10, 19, 115] : `a chaque couche, on associe ainsi un plan de profondeur1. Il faut alors d´efinir les «pas » de disparit´e souhait´e.

Motivation technique

Le choix de la repr´esentation en couches est aussi motiv´e pour des raisons techniques dans le cadre de l’analyse du mouvement via le flot optique. Ce dernier est souvent uti-lis´e en tant qu’information de bas-niveau pour de nombreux algorithmes d’analyse du mouvement pour des applications diverses et vari´ees telles que la d´etection d’objets en d´eplacement, la compression vid´eo, la compl´etion de texture anim´ee ou encore la segmen-tation via le mouvement. Nous verrons dans le chapitre suivant, d´edi´e `a l’estimation du mouvement (afin de ne pas rentrer dans les d´etails ici), que le calcul du flot optique est sujet

`a de nombreuses difficult´es : occultations, ambigu¨ıt´es de couleurs et de forme, sp´ecularit´e des surfaces, etc. C’est notamment un probl`eme dit mal-pos´e car le nombre d’inconnues

`a estimer d´epasse le nombre de contraintes disponibles. Par contre, si nous consid´erons un mouvement similaire (param´etrique ou non) pour l’ensemble des pixels appartenant

`a une mˆeme r´egion, de nombreuses difficult´es propres au flot optique disparaissent car le probl`eme devient alorssur-contraint. Ainsi, plutˆot que d’estimer le mouvement en chaque

1On consid`ere alors l’hypoth`ese que les surfaces des objets sont fronto-parall`eles, i.e. parall`eles au plan du capteur de la cam´era.

25

Sec. 1.1. D´efinition d’une couche

= (a) recalage

= (b) flot optique

= (c) segmentation

= (d) disparit´e

Figure 1.4 – Quatre cas possibles pour fixer le nombre de couches selon l’application consid´er´ee. (a) recalage d’images, (b) flot optique, (c) segmentation via le mouvement, (d) disparit´e (st´er´eovision).

Chap. 1. Segmentation en couches

pixel de fa¸con ind´ependante ou en consid´erant son voisinage imm´ediat. Il est g´en´erale-ment plus efficace, en terme de qualit´e, d’estimer le mouveg´en´erale-ment propre `a une r´egion o`u tous les pixels suivent a priori un mouvement similaire, pour en d´eterminer ensuite leurs mouvements respectifs. L’´etat de l’art dress´e plus loin pr´esente quelques-uns des travaux qui se sont appuy´es sur cette id´ee.

Choix du mod`ele param´etrique

Toute la cl´e de la segmentation en couches r´eside dans le choix du mod`ele de mouve-ment pour chaque couche. Car celui-ci doit repr´esenter le mouvemouve-ment de tous les pixels appartenant `a une mˆeme r´egion de fa¸con suffisamment pr´ecise et g´en´erique. Le mod`ele projectif est g´en´eralement retenu en raison de sa g´en´ericit´e. Il permet de repr´esenter en effet le mouvement propre `a la projection d’un mˆeme plan 3D tout en incluant les mou-vements affines souvent rencontr´es (translation / rotation / expansion / contraction). Il est de surcroˆıt assez simple `a estimer. Cependant, il lui est souvent pr´ef´er´e le mod`ele affine, moins complexe encore. Le chapitre 2 reviendra en d´etail sur le choix du mod`ele de mouvement et de son estimation.

1.1.3 Probl´ ematique du th` eme

Extraire les couches consiste `a r´esoudre trois probl`emes : 1. Quelles sont les r´egions ?

2. Quels sont leurs mouvements ?1

3. Quel est le nombre de couches ? (optionnel, comme nous le verrons plus loin) Ces trois inconnues sont difficiles `a d´eterminer simultan´ement, la complexit´e ´etant g´en´era-lement combinatoire. Une grande vari´et´e d’algorithmes a ´et´e d´evelopp´ee pour d´eterminer ces trois inconnues. Ce sont g´en´eralement des approches it´eratives o`u l’on fixe une ou deux inconnues pour estimer la troisi`eme. D’autres approches sont directes mais connaissent des restrictions. La section suivante revient sur les diverses approches qui visent `a extraire les mouvements et les couches d’une s´equence vid´eo afin de bien situer le cheminement de la recherche dans le domaine. Puis nous rentrerons davantage dans les d´etails pour une technique majeure qui nous int´eresse plus particuli`erement ici, celle de Xiao et Shah [143].

Dans le document The DART-Europe E-theses Portal (Page 29-34)