Le but de la d´etection est de localiser automatiquement une personne dans une image
ou une vid´eo et de rendre en sortie l’image ou la vid´eo avec une boite englobante
enca-drant chaque personne d´etect´ee (voir Figure 2.6).
Une perspective assez int´eressante, et d´evelopp´ee dans un certain nombre d’´etudes
r´ecentes, est d’arriver `a une d´etection pr´ecise, c’est-`a-dire `a segmenter la personne (voir
Figure 2.6). La personne d´etect´ee ne sera alors plus rep´er´ee par une boˆıte englobante mais
par ses propres contours. Ceci a de nombreuses applications pratiques comme on l’a vu
dans l’introduction.
Il est possible de r´ealiser `a la suite et ind´ependamment la d´etection et la segmentation.
Fig. 2.6 – La d´etection seule encadre la personne d´etect´ee dans une boˆıte englobante (`a
gauche) alors que la segmentation donne les contours pr´ecis de celle-ci (`a droite).
N´eanmoins, la segmentation peut permettre une am´elioration des r´esultats de la d´etection.
Il est alors int´eressant de coupler les deux proc´ed´es en une m´ethode.
2.2.1 Par analyse de r´egions d’interˆets
Il est parfois facile d’isoler dans l’image un certain nombre de r´egions d’int´erˆets.
Le plus facile ´etant lorsque le syst`eme d’acquisition peut ˆetre choisi. En effet, avec
une cam´era st´er´eo, le param`etre de profondeur peut ˆetre facilement calcul´e. Ainsi, la
forme de la personne est directement donn´ee sans aucun processus de segmentation
[Gavrila and Munder, 2007] [Xu and Fujimura, 2003].
Mori et al.[Mori et al., 2004] utilisent une segmentation par coupe normalis´ee (voir Figure
2.7) qui s´epare l’image en un nombre pr´ed´efini de r´egions coh´erentes puis rep`ere les
sous-parties du corps humains grˆace `a leurs contraintes physiques. Lu et al.[Lu et al., 2008]
pr´esentent aussi un algorithme de mise en relation de r´egions appartenant `a une mˆeme
personne.
Fig.2.7 – L’algorithme de segmentation en coupe normalis´ee s´epare l’image en un nombre
donn´e de r´egions (ici 40).
2.2.2 Par comparaison `a un catalogue de gabarits
De nombreuses m´ethodes utilisent un catalogue de gabarits afin de d´etecter les
personnes pr´esentes sur une image [Munder and Gavrila, 2006] [Wang and Cohen, 2005].
Il s’agit en fait d’une liste regroupant le panel le plus vari´e d’exemples correspondant `a
la classe recherch´ee. Une comparaison est alors r´ealis´ee entre l’image test´ee et l’ensemble
des ´el´ements du catalogue. Si un des membres du catalogue est vraiment tr`es proche,
alors il y a d´etection de la classe.
Int´egration de la segmentation
Dans la grande majorit´e des cas, le catalogue utilis´e est un catalogue de gabarits de
formes (voir Figure 2.8). En effet, la forme est la caract´eristique la plus discriminante
de la classe des personnes. La m´ethode doit donc soit isoler des contours par un filtrage
comme celui de Canny [Zhao and Davis, 2005], soit faire des associations de sous r´egions
[Mori et al., 2004] puis comparer aux membres du catalogue.
Fig. 2.8 – Exemple de catalogue de gabarits
Un mod`ele de silhouette proche de celui de la personne pr´esente sur l’image test´ee
est alors obtenu. Selon les caract´eristiques (couleurs) de l’image, la silhouette est alors
adapt´ee pour bien correspondre aux contours de la personne [Rodriguez and Shah, 2007]
par un alignement des centro¨ıdes. Ce qui r´ealise finalement la segmentation.
Il est aussi possible `a partir d’exemples de gabarits proches, de rentrer dans chaque
gabarit la notion de d´eformabilit´e qui donnera les parties du mod`ele qui sont les plus
variables [Ferrari et al., 2007].
Le catalogue peut contenir autre chose que des silhouettes. Liu et
Sarkar[Liu and Sarkar, 2004] y listent des projections sur des espaces propres et
[Murai et al., 2007] des matrices repr´esentatives des gradients dans l’espace
spatio-temporel.
Avec une hi´erarchie
Comparer les caract´eristiques de l’image test´ee avec l’ensemble des gabarits d’un
catalogue prend beaucoup de temps. Une solution pour r´eduire la quantit´e de calcul
est d’utiliser une classification hi´erarchique des gabarits [Gavrila and Philomin, 1999]
[Gavrila and Giebel, 2002] [Shotton et al., 2008b]. L’id´ee est de retenir un petit nombre
de gabarits les plus diff´erents possibles et d’associer `a chacun d’eux un autre petit nombre
de gabarits proches mais diff´erents entre eux et ainsi de suite sur plusieurs ´etages pour
former une pyramide (voir Figure 2.9). `A chaque ´etage, une comparaison est faite avec
chacun des gabarits pour d´eterminer le chemin dans la pyramide qui m`ene au gabarit le
plus proche de la silhouette ´etudi´ee. Celui-ci est trouv´e avec un nombre r´eduit de
compa-raisons.
Fig. 2.9 – `A gauche : classification hi´erarchique de gabarits. `A droite : classification par
parties de Lin et al.[Lin et al., 2007a].
Lin et al. [Lin et al., 2007a] pr´esentent une l´eg`ere variante en d´ecoupant chaque gabarit
en trois parties : la partie haute, le bassin et les jambes. Puis ils r´ealisent une pyramide
o`u chaque ´etage repr´esente tous les ´etats possible d’une partie par rapport aux parties
d´ej`a s´electionn´ees aux ´etages pr´ec´edents (voir Figure 2.9).
2.2.3 Par analyse de segments
La forme ´etant la caract´eristique la plus discriminante, le contour est souvent ´etudi´e.
Une id´ee est de le d´ecomposer en segments (droits ou courbes) et de reconnaˆıtre ces
segments. Si les contours d’un objet sont d´etect´es, alors la segmentation est aussi effectu´ee.
Shotton et al. [Shotton et al., 2008a] d´emontrent que la reconnaissance d’un petit
nombre de segments bien choisis, car caract´eristiques, permet de d´etecter les ´el´ements
de certaines classes. Il suffit alors de reconnaˆıtre les segments un `a un et de v´erifier leur
ordonnancement et leurs relations. Une cascade de classifieurs pour reconnaˆıtre chacun
des segments les plus importants est introduite par Wu et Nevatia [Wu and Nevatia, 2007].
La notion de cycle peut ˆetre ajout´ee au probl`eme. Il s’agit d’essayer de former un
cycle de segments de contours en reliant les segments par une valeur de continuit´e
de distance, d’orientation et d’intensit´e. Sharma et Davis [Sharma and Davis, 2007]
proposent une coupe de graphe d’un mod`ele cach´e de Markov reliant les cycles `a leur
probabilit´e d’appartenir `a une personne afin d’obtenir le cycle de contour donnant la
silhouette de la personne d´etect´ee. Cette m´ethode, comme celle que nous proposons
en section 4, cherche les cycles de segments de contour pour reconstruire la silhouette
recherch´ee. Mais, contrairement `a notre m´ethode, la connaissance de la classe n’est pas
pr´esente dans l’´etude du graphe mais int´egr´ee dans une seconde ´etape. Ferrari et al.
[Ferrari et al., 2006] d´ecomposent le mod`ele de la silhouette de r´ef´erence en une suite
ordonn´ee de segments. Cette suite est ensuite recherch´ee dans le mˆeme ordre dans l’image
test´ee. Cette m´ethode ne fonctionne que sur des classes dont la forme des ´el´ements la
composant varie peu.
Fig.2.10 – ´A gauche : segments caract´eristiques permettant la reconnaissance selon
Shot-ton et al.[ShotShot-ton et al., 2008a]. `A droite : segments reconnus par les classifieurs de Wu
et Nevatia[Wu and Nevatia, 2007].
2.2.4 Par d’autres m´ethodes
Il existe d’autres m´ethodes qui prolongent celles pr´esent´ees ci-dessus. La notion
de mouvement peut par exemple ˆetre prise en compte. Par ACP, Liu et Sarkar
[Liu and Sarkar, 2004] r´ealisent une d´ecomposition en espaces propres de silhouettes en
tron¸cons de mouvement (voir Figure 2.11). Une projection des caract´eristiques de l’image
test´ee sur les premiers espaces du mod`ele le plus proche recompose le contour. Yilmaz et
Shah [Yilmaz and Shah, 2004] pr´esentent une m´ethode de suivi de contours `a partir des
couleurs et de la v´elocit´e.
Zhao et Davis [Zhao and Davis, 2005] pr´esentent une m´ethode qui utilise it´erativement
une m´ethode de comparaison `a un catalogue de gabarits avec une m´ethode de s´eparation
sur les couleurs. Le gabarit choisi d´etermine les mod`eles de couleurs et la s´eparation des
couleurs affine la forme `a comparer aux gabarits. La segmentation est plus pr´ecise `a chaque
it´eration (voir Figure 2.11).
Fig. 2.11 – Au dessus : exemples d’espaces propres par Liu et
Sarkar[Liu and Sarkar, 2004]. En dessous : progression des it´erations de Zhao et
Davis [Zhao and Davis, 2005].
D´etection et segmentation peuvent ˆetre int´egr´ees dans un cadre probabiliste par un
mod`ele de forme implicite (ISM) [Leibe et al., 2004]. Un catalogue d’apparences locales
contient la structure locale de la classe. L’ISM sp´ecifie les positions relatives de ces
infor-mations. La comparaison des r´egions entourant les points d’interˆets avec ce mod`ele par
une transform´ee de Hough donne une formulation probabiliste qui permet la d´etection.
Une vue probabiliste au niveau du pixel donne ensuite la segmentation.
2.2.5 Validation de la d´etection par la segmentation
La segmentation s’obtient apr`es la d´etection. N´eanmoins, la segmentation peut ˆetre
utilis´ee pour valider la d´etection et ainsi r´eduire son taux de fausse d´etection. Pour
certaines m´ethodes de d´etection, une segmentation grossi`ere est calcul´ee afin d’obtenir
de meilleurs r´esultats.
Ramanan [Ramanan, 2007] cr´ee un mod`ele spatial d’une classe. Une coupe de graphe
guid´ee par les histogrammes de luminance produits par ce mod`ele donne une
segmenta-tion. Puis l’apprentissage d’un classifieur SVM est r´ealis´e `a partir des segmentations ainsi
obtenues pour des exemples contenant un ´el´ement de la classe et d’autres n’en contenant
pas. Ce classifieur permet finalement de valider la d´etection.
Ott et Everingham proposent une ´etape de segmentation int´egr´ee dans le processus de
d´etection par HOG [Ott and Everingham, 2009]. Pour chaque bloc (voir section 3.3.1),
une segmentation non binaire par discriminant de Fisher est r´ealis´ee par une projection
en couleur qui maximise la s´eparation entre premier et arri`ere-plan selon quatre positions
de potentiels de r´ef´erence. L’histogramme de gradients orient´es de cette segmentation
(appel´e CHOG) est ajout´e au HOG pour le rendre plus discriminant.
Dans le document
Segmentation de personnes dans les images et les vidéos
(Page 34-38)