• Aucun résultat trouvé

3.2 Détection de personnes

3.2.5 Détection de parties du corps

Les méthodes de détection par la structure interne furent les prémices de la détection d'êtres humains par la détection de leurs composants. L'idée du détecteur de Viola et Jones était de construire une représentation de la structure interne du visage, un visage étant composé de deux yeux, un nez, une bouche. Cette idée a ensuite été reprise par Pa- pageorgiou [Papageorgiou 99]. Il a entraîné un détecteur avec des images de corps humain entier. Des ondelettes de Haar furent utilisées pour extraire les caractéristiques images et des Machines à vecteurs de support (Support Vector Machine(SVM)) les classaient. Cependant cette méthode ne sourait aucune occultation des parties du corps.

Mohan avec Papageorgiou et al. [Mohan 01] réutilisèrent la première idée, mais cette fois-ci en créant spéciquement un détecteur pour chaque partie du corps : la tête, le bras gauche, le bras droit, le bas du corps. Les sorties de chacun de ces détecteurs étaient ensuite regroupées et classées par un dernier détecteur déterminant si l'assemblage des parties constituait ou non une personne. Cependant l'ensemble d'apprentissage ne contenait que des images représentant des personnes debout les bras le long du corps, et donc leur détecteur n'était capable de détecter que les personnes dans cette posture.

Apprentissage SVM SVM SVM SVM SVM Association de parties Echantillons Partie 1

Fig. 3.10: Système de détection de personnes à partir de leurs parties de Mohan et Papageor- giou [Mohan 01]. Quatre détecteurs ont été entraînés à partir d'images de parties du corps : le haut du corps, le côté gauche du torse, le côté droit et le bas du corps. Ces quatre parties sont tout d'abord détectées, puis les résultats de leur détection sont transmis à un classieur validant ou non l'assemblage des parties comme étant une personne.

Dans le but d'obtenir des assemblages plus souples de parties de personne, Felzensz- walb et Huttenlocher [Felzenszwalb 00] autorisent les parties du corps à s'assembler dans diérentes congurations. Un modèle de connections en ressort entre chaque paire de par- ties dénit alors les limites des déformations. Ils fournissent un modèle géométrique 2D de parties du corps ainsi qu'un modèle d'articulation. Chaque partie du corps du modèle est paramétrée par son centre de masse (x, y), son orientation θ et son facteur d'échelle s. Les articulations sont paramétrées par leur position, spéciée par deux points (xij, yij)

et (xji, yji), chacun des points étant exprimé dans le repère de chacune des parties. Dans

une conguration idéale, ces deux points sont confondus (voir gure(3.11)). Le recalage des parties du corps dans l'image s'eectue sur la couleur de chacune des parties. Ces couleurs sont spéciées par l'utilisateur au début du traitement.

Articulations Calcul meilleur agencement Couleurs Detection couleur

Fig. 3.11: Système de détection de parties du corps de Felzenszwalb et Huttenlocher [Felzenszwalb 00].

L'utilisation de modèles régissant l'assemblage des diérentes parties du corps a ensuite été étendue par Rémi Ronfard et al. [Ronfard 02], qui ont introduit un modèle articulaire,

3.2. Détection de personnes morphologiquement plus réaliste (voir gure 3.12). Leur modèle de personne est composé de quinze parties du corps diérentes, chacune détectée séparément par des SVMs où des ltres gaussiens appliqués sur les gradients de l'image servaient de caractéristiques image. Un autre SVM est entraîné sur les paramètres de rigidité articulaire choisissant la meilleure des congurations possible des parties du corps. Malheureusement les résultats exposés ne montrent, là encore, que des personnes debout avec les bras le long du corps.

SVM SVM SVM SVM SVM SVM SVM SVM SVM SVM SVM SVM SVM SVM SVM RVM RVM RVM RVM RVM RVM RVM RVM RVM RVM RVM RVM RVM RVM RVM SVM SVM SVM SVM SVM SVM SVM Apprentissage Caract´eristiques parties Param`etres de Articulations Pond´eration ´echantillons positif/n´egatifs Calcul meilleur agencement rigidit´e articulaire

Fig. 3.12: Système de détection de partie du corps de Ronfard, Shmid et Triggs [Ronfard 02].

Antonio Micilotta, Eng Jon Ong et Richard Bowden [Micilotta 05a] n'utilisent pas explicitement de modèle articulé pour estimer les positions articulaires, mais construisent par apprentissage un modèle statistique permettant d'inférer la position du coude à partir de la position des mains, de la tête ainsi que du torse. Leur méthode (gure 3.13) consiste à eectuer plusieurs détections d'une manière grossière puis en les anant au fur et à mesure. Ils commencent par détecter diérentes parties du corps, le haut, le bas, la tête et les mains, à l'aide de classieurs : un détecteur de couleur de peau leur permet de réduire le nombre de fausses alarmes pour la tête et les mains. Ils utilisent ensuite l'algorithme RANSAC pour sélectionner les ensembles de parties détectées correspondant à une simple heuristique : les proportions du corps humain, données dans ce cas par l'homme vitruvian de DeVinci. La meilleure conguration est ensuite sélectionnée dans cet ensemble à l'aide d'un modèle a priori de conguration de haut du corps, ici une mélange de Gaussiennes. Ce modèle a été construit à partir de 4500 images étiquetées manuellement. Les congurations sont représentées par huit points : les quatres coins du rectangle représentant le torse, les centres du front et du menton détectés et les centres des mains.

Adaboost Adaboost Adaboost Adaboost RANSAC S´election d’assemblage de parties S´election Configuration la plus probable Inf´erence positions des coudes

Parties du corps Couleur

PDM Positions a priori Positions a priori plus coudes D´etection parties du corps et couleur de peau

de peau Heuristique longueurdes parties du corps

GMM

mains, menton, front, coins du torse

Fig. 3.13: Système de détection de parties du corps de Micilotta, Ong et Bowden [Micilotta 05a].