• Aucun résultat trouvé

D´etection et segmentation simultann´ee

Le but de la d´etection est de localiser automatiquement une personne dans une image

ou une vid´eo et de rendre en sortie l’image ou la vid´eo avec une boite englobante

enca-drant chaque personne d´etect´ee (voir Figure 2.6).

Une perspective assez int´eressante, et d´evelopp´ee dans un certain nombre d’´etudes

r´ecentes, est d’arriver `a une d´etection pr´ecise, c’est-`a-dire `a segmenter la personne (voir

Figure 2.6). La personne d´etect´ee ne sera alors plus rep´er´ee par une boˆıte englobante mais

par ses propres contours. Ceci a de nombreuses applications pratiques comme on l’a vu

dans l’introduction.

Il est possible de r´ealiser `a la suite et ind´ependamment la d´etection et la segmentation.

Fig. 2.6 – La d´etection seule encadre la personne d´etect´ee dans une boˆıte englobante (`a

gauche) alors que la segmentation donne les contours pr´ecis de celle-ci (`a droite).

N´eanmoins, la segmentation peut permettre une am´elioration des r´esultats de la d´etection.

Il est alors int´eressant de coupler les deux proc´ed´es en une m´ethode.

2.2.1 Par analyse de r´egions d’interˆets

Il est parfois facile d’isoler dans l’image un certain nombre de r´egions d’int´erˆets.

Le plus facile ´etant lorsque le syst`eme d’acquisition peut ˆetre choisi. En effet, avec

une cam´era st´er´eo, le param`etre de profondeur peut ˆetre facilement calcul´e. Ainsi, la

forme de la personne est directement donn´ee sans aucun processus de segmentation

[Gavrila and Munder, 2007] [Xu and Fujimura, 2003].

Mori et al.[Mori et al., 2004] utilisent une segmentation par coupe normalis´ee (voir Figure

2.7) qui s´epare l’image en un nombre pr´ed´efini de r´egions coh´erentes puis rep`ere les

sous-parties du corps humains grˆace `a leurs contraintes physiques. Lu et al.[Lu et al., 2008]

pr´esentent aussi un algorithme de mise en relation de r´egions appartenant `a une mˆeme

personne.

Fig.2.7 – L’algorithme de segmentation en coupe normalis´ee s´epare l’image en un nombre

donn´e de r´egions (ici 40).

2.2.2 Par comparaison `a un catalogue de gabarits

De nombreuses m´ethodes utilisent un catalogue de gabarits afin de d´etecter les

personnes pr´esentes sur une image [Munder and Gavrila, 2006] [Wang and Cohen, 2005].

Il s’agit en fait d’une liste regroupant le panel le plus vari´e d’exemples correspondant `a

la classe recherch´ee. Une comparaison est alors r´ealis´ee entre l’image test´ee et l’ensemble

des ´el´ements du catalogue. Si un des membres du catalogue est vraiment tr`es proche,

alors il y a d´etection de la classe.

Int´egration de la segmentation

Dans la grande majorit´e des cas, le catalogue utilis´e est un catalogue de gabarits de

formes (voir Figure 2.8). En effet, la forme est la caract´eristique la plus discriminante

de la classe des personnes. La m´ethode doit donc soit isoler des contours par un filtrage

comme celui de Canny [Zhao and Davis, 2005], soit faire des associations de sous r´egions

[Mori et al., 2004] puis comparer aux membres du catalogue.

Fig. 2.8 – Exemple de catalogue de gabarits

Un mod`ele de silhouette proche de celui de la personne pr´esente sur l’image test´ee

est alors obtenu. Selon les caract´eristiques (couleurs) de l’image, la silhouette est alors

adapt´ee pour bien correspondre aux contours de la personne [Rodriguez and Shah, 2007]

par un alignement des centro¨ıdes. Ce qui r´ealise finalement la segmentation.

Il est aussi possible `a partir d’exemples de gabarits proches, de rentrer dans chaque

gabarit la notion de d´eformabilit´e qui donnera les parties du mod`ele qui sont les plus

variables [Ferrari et al., 2007].

Le catalogue peut contenir autre chose que des silhouettes. Liu et

Sarkar[Liu and Sarkar, 2004] y listent des projections sur des espaces propres et

[Murai et al., 2007] des matrices repr´esentatives des gradients dans l’espace

spatio-temporel.

Avec une hi´erarchie

Comparer les caract´eristiques de l’image test´ee avec l’ensemble des gabarits d’un

catalogue prend beaucoup de temps. Une solution pour r´eduire la quantit´e de calcul

est d’utiliser une classification hi´erarchique des gabarits [Gavrila and Philomin, 1999]

[Gavrila and Giebel, 2002] [Shotton et al., 2008b]. L’id´ee est de retenir un petit nombre

de gabarits les plus diff´erents possibles et d’associer `a chacun d’eux un autre petit nombre

de gabarits proches mais diff´erents entre eux et ainsi de suite sur plusieurs ´etages pour

former une pyramide (voir Figure 2.9). `A chaque ´etage, une comparaison est faite avec

chacun des gabarits pour d´eterminer le chemin dans la pyramide qui m`ene au gabarit le

plus proche de la silhouette ´etudi´ee. Celui-ci est trouv´e avec un nombre r´eduit de

compa-raisons.

Fig. 2.9 – `A gauche : classification hi´erarchique de gabarits. `A droite : classification par

parties de Lin et al.[Lin et al., 2007a].

Lin et al. [Lin et al., 2007a] pr´esentent une l´eg`ere variante en d´ecoupant chaque gabarit

en trois parties : la partie haute, le bassin et les jambes. Puis ils r´ealisent une pyramide

o`u chaque ´etage repr´esente tous les ´etats possible d’une partie par rapport aux parties

d´ej`a s´electionn´ees aux ´etages pr´ec´edents (voir Figure 2.9).

2.2.3 Par analyse de segments

La forme ´etant la caract´eristique la plus discriminante, le contour est souvent ´etudi´e.

Une id´ee est de le d´ecomposer en segments (droits ou courbes) et de reconnaˆıtre ces

segments. Si les contours d’un objet sont d´etect´es, alors la segmentation est aussi effectu´ee.

Shotton et al. [Shotton et al., 2008a] d´emontrent que la reconnaissance d’un petit

nombre de segments bien choisis, car caract´eristiques, permet de d´etecter les ´el´ements

de certaines classes. Il suffit alors de reconnaˆıtre les segments un `a un et de v´erifier leur

ordonnancement et leurs relations. Une cascade de classifieurs pour reconnaˆıtre chacun

des segments les plus importants est introduite par Wu et Nevatia [Wu and Nevatia, 2007].

La notion de cycle peut ˆetre ajout´ee au probl`eme. Il s’agit d’essayer de former un

cycle de segments de contours en reliant les segments par une valeur de continuit´e

de distance, d’orientation et d’intensit´e. Sharma et Davis [Sharma and Davis, 2007]

proposent une coupe de graphe d’un mod`ele cach´e de Markov reliant les cycles `a leur

probabilit´e d’appartenir `a une personne afin d’obtenir le cycle de contour donnant la

silhouette de la personne d´etect´ee. Cette m´ethode, comme celle que nous proposons

en section 4, cherche les cycles de segments de contour pour reconstruire la silhouette

recherch´ee. Mais, contrairement `a notre m´ethode, la connaissance de la classe n’est pas

pr´esente dans l’´etude du graphe mais int´egr´ee dans une seconde ´etape. Ferrari et al.

[Ferrari et al., 2006] d´ecomposent le mod`ele de la silhouette de r´ef´erence en une suite

ordonn´ee de segments. Cette suite est ensuite recherch´ee dans le mˆeme ordre dans l’image

test´ee. Cette m´ethode ne fonctionne que sur des classes dont la forme des ´el´ements la

composant varie peu.

Fig.2.10 – ´A gauche : segments caract´eristiques permettant la reconnaissance selon

Shot-ton et al.[ShotShot-ton et al., 2008a]. `A droite : segments reconnus par les classifieurs de Wu

et Nevatia[Wu and Nevatia, 2007].

2.2.4 Par d’autres m´ethodes

Il existe d’autres m´ethodes qui prolongent celles pr´esent´ees ci-dessus. La notion

de mouvement peut par exemple ˆetre prise en compte. Par ACP, Liu et Sarkar

[Liu and Sarkar, 2004] r´ealisent une d´ecomposition en espaces propres de silhouettes en

tron¸cons de mouvement (voir Figure 2.11). Une projection des caract´eristiques de l’image

test´ee sur les premiers espaces du mod`ele le plus proche recompose le contour. Yilmaz et

Shah [Yilmaz and Shah, 2004] pr´esentent une m´ethode de suivi de contours `a partir des

couleurs et de la v´elocit´e.

Zhao et Davis [Zhao and Davis, 2005] pr´esentent une m´ethode qui utilise it´erativement

une m´ethode de comparaison `a un catalogue de gabarits avec une m´ethode de s´eparation

sur les couleurs. Le gabarit choisi d´etermine les mod`eles de couleurs et la s´eparation des

couleurs affine la forme `a comparer aux gabarits. La segmentation est plus pr´ecise `a chaque

it´eration (voir Figure 2.11).

Fig. 2.11 – Au dessus : exemples d’espaces propres par Liu et

Sarkar[Liu and Sarkar, 2004]. En dessous : progression des it´erations de Zhao et

Davis [Zhao and Davis, 2005].

D´etection et segmentation peuvent ˆetre int´egr´ees dans un cadre probabiliste par un

mod`ele de forme implicite (ISM) [Leibe et al., 2004]. Un catalogue d’apparences locales

contient la structure locale de la classe. L’ISM sp´ecifie les positions relatives de ces

infor-mations. La comparaison des r´egions entourant les points d’interˆets avec ce mod`ele par

une transform´ee de Hough donne une formulation probabiliste qui permet la d´etection.

Une vue probabiliste au niveau du pixel donne ensuite la segmentation.

2.2.5 Validation de la d´etection par la segmentation

La segmentation s’obtient apr`es la d´etection. N´eanmoins, la segmentation peut ˆetre

utilis´ee pour valider la d´etection et ainsi r´eduire son taux de fausse d´etection. Pour

certaines m´ethodes de d´etection, une segmentation grossi`ere est calcul´ee afin d’obtenir

de meilleurs r´esultats.

Ramanan [Ramanan, 2007] cr´ee un mod`ele spatial d’une classe. Une coupe de graphe

guid´ee par les histogrammes de luminance produits par ce mod`ele donne une

segmenta-tion. Puis l’apprentissage d’un classifieur SVM est r´ealis´e `a partir des segmentations ainsi

obtenues pour des exemples contenant un ´el´ement de la classe et d’autres n’en contenant

pas. Ce classifieur permet finalement de valider la d´etection.

Ott et Everingham proposent une ´etape de segmentation int´egr´ee dans le processus de

d´etection par HOG [Ott and Everingham, 2009]. Pour chaque bloc (voir section 3.3.1),

une segmentation non binaire par discriminant de Fisher est r´ealis´ee par une projection

en couleur qui maximise la s´eparation entre premier et arri`ere-plan selon quatre positions

de potentiels de r´ef´erence. L’histogramme de gradients orient´es de cette segmentation

(appel´e CHOG) est ajout´e au HOG pour le rendre plus discriminant.