D´etection et segmentation simultann´ee - Segmentation de personnes dans les images et les vidé

Le but de la d´etection est de localiser automatiquement une personne dans une image

ou une vid´eo et de rendre en sortie l’image ou la vid´eo avec une boite englobante

enca-drant chaque personne d´etect´ee (voir Figure 2.6).

Une perspective assez intéressante, et développée dans un certain nombre d’études

récentes, est d’arriver à une détection précise, c’est-à-dire à segmenter la personne (voir

Figure 2.6). La personne détectée ne sera alors plus repérée par une boˆıte englobante mais

par ses propres contours. Ceci a de nombreuses applications pratiques comme on l’a vu

dans l’introduction.

Il est possible de réaliser à la suite et indépendamment la détection et la segmentation.

Fig. 2.6 – La détection seule encadre la personne détectée dans une boˆıte englobante (à

gauche) alors que la segmentation donne les contours pr´ecis de celle-ci (`a droite).

Néanmoins, la segmentation peut permettre une amélioration des résultats de la détection.

Il est alors intéressant de coupler les deux procédés en une méthode.

2.2.1 Par analyse de r´egions d’interˆets

Il est parfois facile d’isoler dans l’image un certain nombre de régions d’intérêts.

Le plus facile étant lorsque le système d’acquisition peut être choisi. En effet, avec

une caméra stéréo, le paramètre de profondeur peut être facilement calculé. Ainsi, la

forme de la personne est directement donn´ee sans aucun processus de segmentation

[Gavrila and Munder, 2007] [Xu and Fujimura, 2003].

Mori et al.[Mori et al., 2004] utilisent une segmentation par coupe normalis´ee (voir Figure

2.7) qui sépare l’image en un nombre prédéfini de régions cohérentes puis repère les

sous-parties du corps humains grˆace `a leurs contraintes physiques. Lu et al.[Lu et al., 2008]

présentent aussi un algorithme de mise en relation de régions appartenant à une même

personne.

Fig.2.7 – L’algorithme de segmentation en coupe normalis´ee s´epare l’image en un nombre

donn´e de r´egions (ici 40).

2.2.2 Par comparaison `a un catalogue de gabarits

De nombreuses m´ethodes utilisent un catalogue de gabarits afin de d´etecter les

personnes pr´esentes sur une image [Munder and Gavrila, 2006] [Wang and Cohen, 2005].

Il s’agit en fait d’une liste regroupant le panel le plus vari´e d’exemples correspondant `a

la classe recherchée. Une comparaison est alors réalisée entre l’image testée et l’ensemble

des éléments du catalogue. Si un des membres du catalogue est vraiment très proche,

alors il y a d´etection de la classe.

Int´egration de la segmentation

Dans la grande majorit´e des cas, le catalogue utilis´e est un catalogue de gabarits de

formes (voir Figure 2.8). En effet, la forme est la caract´eristique la plus discriminante

de la classe des personnes. La m´ethode doit donc soit isoler des contours par un filtrage

comme celui de Canny [Zhao and Davis, 2005], soit faire des associations de sous r´egions

[Mori et al., 2004] puis comparer aux membres du catalogue.

Fig. 2.8 – Exemple de catalogue de gabarits

Un modèle de silhouette proche de celui de la personne présente sur l’image testée

est alors obtenu. Selon les caract´eristiques (couleurs) de l’image, la silhouette est alors

adapt´ee pour bien correspondre aux contours de la personne [Rodriguez and Shah, 2007]

par un alignement des centro¨ıdes. Ce qui r´ealise finalement la segmentation.

Il est aussi possible `a partir d’exemples de gabarits proches, de rentrer dans chaque

gabarit la notion de déformabilité qui donnera les parties du modèle qui sont les plus

variables [Ferrari et al., 2007].

Le catalogue peut contenir autre chose que des silhouettes. Liu et

Sarkar[Liu and Sarkar, 2004] y listent des projections sur des espaces propres et

[Murai et al., 2007] des matrices repr´esentatives des gradients dans l’espace

spatio-temporel.

Avec une hi´erarchie

Comparer les caract´eristiques de l’image test´ee avec l’ensemble des gabarits d’un

catalogue prend beaucoup de temps. Une solution pour r´eduire la quantit´e de calcul

est d’utiliser une classification hi´erarchique des gabarits [Gavrila and Philomin, 1999]

[Gavrila and Giebel, 2002] [Shotton et al., 2008b]. L’id´ee est de retenir un petit nombre

de gabarits les plus diff´erents possibles et d’associer `a chacun d’eux un autre petit nombre

de gabarits proches mais diff´erents entre eux et ainsi de suite sur plusieurs ´etages pour

former une pyramide (voir Figure 2.9). `A chaque ´etage, une comparaison est faite avec

chacun des gabarits pour d´eterminer le chemin dans la pyramide qui m`ene au gabarit le

plus proche de la silhouette étudiée. Celui-ci est trouvé avec un nombre réduit de

compa-raisons.

Fig. 2.9 – À gauche : classification hiérarchique de gabarits. À droite : classification par

parties de Lin et al.[Lin et al., 2007a].

Lin et al. [Lin et al., 2007a] présentent une légère variante en découpant chaque gabarit

en trois parties : la partie haute, le bassin et les jambes. Puis ils r´ealisent une pyramide

où chaque étage représente tous les états possible d’une partie par rapport aux parties

déjà sélectionnées aux étages précédents (voir Figure 2.9).

2.2.3 Par analyse de segments

La forme étant la caractéristique la plus discriminante, le contour est souvent étudié.

Une id´ee est de le d´ecomposer en segments (droits ou courbes) et de reconnaˆıtre ces

segments. Si les contours d’un objet sont détectés, alors la segmentation est aussi effectuée.

Shotton et al. [Shotton et al., 2008a] d´emontrent que la reconnaissance d’un petit

nombre de segments bien choisis, car caractéristiques, permet de détecter les éléments

de certaines classes. Il suffit alors de reconnaˆıtre les segments un `a un et de v´erifier leur

ordonnancement et leurs relations. Une cascade de classifieurs pour reconnaˆıtre chacun

des segments les plus importants est introduite par Wu et Nevatia [Wu and Nevatia, 2007].

La notion de cycle peut être ajoutée au problème. Il s’agit d’essayer de former un

cycle de segments de contours en reliant les segments par une valeur de continuit´e

de distance, d’orientation et d’intensit´e. Sharma et Davis [Sharma and Davis, 2007]

proposent une coupe de graphe d’un modèle caché de Markov reliant les cycles à leur

probabilit´e d’appartenir `a une personne afin d’obtenir le cycle de contour donnant la

silhouette de la personne détectée. Cette méthode, comme celle que nous proposons

en section 4, cherche les cycles de segments de contour pour reconstruire la silhouette

recherchée. Mais, contrairement à notre méthode, la connaissance de la classe n’est pas

présente dans l’étude du graphe mais intégrée dans une seconde étape. Ferrari et al.

[Ferrari et al., 2006] décomposent le modèle de la silhouette de référence en une suite

ordonnée de segments. Cette suite est ensuite recherchée dans le même ordre dans l’image

testée. Cette méthode ne fonctionne que sur des classes dont la forme des éléments la

composant varie peu.

Fig.2.10 – ´A gauche : segments caract´eristiques permettant la reconnaissance selon

Shot-ton et al.[ShotShot-ton et al., 2008a]. `A droite : segments reconnus par les classifieurs de Wu

et Nevatia[Wu and Nevatia, 2007].

2.2.4 Par d’autres m´ethodes

Il existe d’autres méthodes qui prolongent celles présentées ci-dessus. La notion

de mouvement peut par exemple ˆetre prise en compte. Par ACP, Liu et Sarkar

[Liu and Sarkar, 2004] r´ealisent une d´ecomposition en espaces propres de silhouettes en

tron¸cons de mouvement (voir Figure 2.11). Une projection des caract´eristiques de l’image

test´ee sur les premiers espaces du mod`ele le plus proche recompose le contour. Yilmaz et

Shah [Yilmaz and Shah, 2004] présentent une méthode de suivi de contours à partir des

couleurs et de la v´elocit´e.

Zhao et Davis [Zhao and Davis, 2005] présentent une méthode qui utilise itérativement

une méthode de comparaison à un catalogue de gabarits avec une méthode de séparation

sur les couleurs. Le gabarit choisi détermine les modèles de couleurs et la séparation des

couleurs affine la forme à comparer aux gabarits. La segmentation est plus précise à chaque

it´eration (voir Figure 2.11).

Fig. 2.11 – Au dessus : exemples d’espaces propres par Liu et

Sarkar[Liu and Sarkar, 2004]. En dessous : progression des it´erations de Zhao et

Davis [Zhao and Davis, 2005].

Détection et segmentation peuvent être intégrées dans un cadre probabiliste par un

mod`ele de forme implicite (ISM) [Leibe et al., 2004]. Un catalogue d’apparences locales

contient la structure locale de la classe. L’ISM sp´ecifie les positions relatives de ces

infor-mations. La comparaison des régions entourant les points d’interêts avec ce modèle par

une transform´ee de Hough donne une formulation probabiliste qui permet la d´etection.

Une vue probabiliste au niveau du pixel donne ensuite la segmentation.

2.2.5 Validation de la d´etection par la segmentation

La segmentation s’obtient après la détection. Néanmoins, la segmentation peut être

utilisée pour valider la détection et ainsi réduire son taux de fausse détection. Pour

certaines méthodes de détection, une segmentation grossière est calculée afin d’obtenir

de meilleurs r´esultats.

Ramanan [Ramanan, 2007] cr´ee un mod`ele spatial d’une classe. Une coupe de graphe

guid´ee par les histogrammes de luminance produits par ce mod`ele donne une

segmenta-tion. Puis l’apprentissage d’un classifieur SVM est réalisé à partir des segmentations ainsi

obtenues pour des exemples contenant un ´el´ement de la classe et d’autres n’en contenant

pas. Ce classifieur permet finalement de valider la d´etection.

Ott et Everingham proposent une étape de segmentation intégrée dans le processus de

d´etection par HOG [Ott and Everingham, 2009]. Pour chaque bloc (voir section 3.3.1),

une segmentation non binaire par discriminant de Fisher est r´ealis´ee par une projection

en couleur qui maximise la s´eparation entre premier et arri`ere-plan selon quatre positions

de potentiels de référence. L’histogramme de gradients orientés de cette segmentation

(appel´e CHOG) est ajout´e au HOG pour le rendre plus discriminant.

Dans le document Segmentation de personnes dans les images et les vidéos (Page 34-38)