• Aucun résultat trouvé

CHAPITRE 2 REVUE DE LA LITTÉRATURE

2.3 Modèle d’apparence

2.3.1 Région d’interêt

La région qui englobe l’objet cible peut prendre différents formats : des points, des formes géométriques ou des contours (voir figure 2.2).

Figure 2.2 Types de détections [Yilmaz et al. (2006)].

— Suivi par points. L’objet cible est représenté par son centroïde ou par un ensemble de points caractéristiques. Le processus de suivi est considéré comme étant un proces- sus d’appariement pixel par pixel entre deux trames successives. On peut distinguer deux approches pour cette catégorie : approches déterministes et approches probabi- listes. L’approche déterministe consiste à minimiser le coût de correspondance, c.-à-d. minimiser la distance calculée sur certaines caractéristiques de l’objet cible. Cette mé- thode est basée sur un ensemble de contraintes : les contraintes de rigidité de l’objet, les contraintes de proximité, les contraintes de vélocité maximale, les contraintes de faibles changements et les contraintes de mouvements communs. Autres que l’appa- rence ou le mouvement d’un objet, les points caractéristiques peuvent être représentés par d’autres paramètres tels que la position, la vélocité et la taille. Le suivi d’ob- jets peut s’effectuer à l’aide des méthodes probabilistes telles que le filtre de Kalman [Yilmaz et al. (2006)].

— Suivi par fenêtres. Les objets sont représentés par des formes géométriques telles qu’un rectangle, une ellipse ou un cercle (peut être une forme qui entoure ou qui est à l’intérieur de l’objet à suivre). Les méthodes de suivi par fenêtres sont baséês sur la conservation de l’apparence de l’objet pendant au moins deux trames consécutives. Dans cette approche, nous pouvons distinguer deux catégories : modèle d’apparence basé sur l’appariement de gabarits [Lin et al. (2007)] et modèle d’apparence multivue. La première catégorie est la méthode la plus simple. Elle est basée sur une mesure de similarité afin de déterminer la corrélation entre le modèle et les régions à suivre. Parmi les mesures de similarité, on peut citer la mesure de corrélation ou la somme des différences au carré. Ces mesures sont basées sur les intensités et les couleurs des objets cibles. Ces dernières sont sensibles aux changements de luminosité. D’autres approches ont été étudiées telles que Mean-Shift [Comaniciu et al. (2003)]. L’approche Mean-Shift consiste à calculer l’histogramme pondéré de couleur pour une région qui englobe l’objet cible. Le principe de cette approche est basé sur la maximalisation de la similarité d’apparence itérativement. L’avantage d’un système de suivi Mean-Shift est d’optimiser la phase de recherche.

L’approche d’appariement de gabarits considère l’apparence de l’objet à partir d’un seul point de vue ce qui la rend appropriée seulement pour les objets dont les po- sitions/orientations ne changent pas considérablement au cours du suivi. De ce fait, d’autres approches qui utilisent un modèle d’apparence multi vue ont été proposées [Black and Jepson (1998)]. Elles consistent à générer un espace d’apparence par ap- prentissage à partir des différents points de vue comme par exemple apprentissage via des classificateurs SVM (Support Vector Machine) [Papageorgiou and Poggio (2000)]. — Suivi par silhouette. La méthode de suivi par fenêtre n’est pas adaptée aux objets

de petite taille ou de formes complexes (qui se déforment durant le processus de suivi). D’où la nécessité de définir les objets à suivre par des formes dynamiques (qui changent avec la forme de l’objet en mouvement). Le suivi par silhouette peut représenter les objets à suivre d’une façon dynamique tout dépendamment de leurs formes. Les méthodes de suivi par silhouette sont basés sur l’extraction de la silhouette ou le contour de la cible à chaque instant. Le principe est de modéliser l’objet de la trame courante tout en utilisant le modèle du même objet dans la trame précédente. Il existe deux classes pour le suivi par silhouette : suivi par appariement de contours et suivi direct du contour.

La méthode de suivi basée sur l’appariement de contours de l’objet est similaire au suivi par appariement de gabarits. En fait, elle consiste à calculer la similarité de l’objet dans la trame courante avec le modèle de l’objet dans la trame précédente. Le

modèle de l’objet est représenté sous forme des arêtes qui décrivent le contour de la cible. Le modèle est nécessairement réinitialisé afin d’éviter tous problèmes liés aux changements de points de vue et de luminosité. Dans Huttenlocher et al. (1993), les auteurs utilisent la distance de Hausdorff pour construire la surface de corrélation entre l’objet et son modèle. Cette distance sert à calculer la distance entre deux ensembles des points A et B de la façon suivante :

H(A, B) = max(h(A, B), h(B, A)) (2.11) Avec :

h(A, B) = supa∈Ainfb∈Bka − bk (2.12)

D’autres méthodes sont basées sur l’utilisation du contour de l’objet cible. Elles consistent à construire itérativement un contour initial en l’évoluant à sa nouvelle position sur la trame courante. L’évolution du contour peut se faire en minimisant des fonctions d’énergie qui peuvent être définies en fonction de l’information temporelle (tel que le flux optique) ou de l’apparence statique déterminer en fonction de l’objet

cible et l’arrière-plan.

— Suivi par parties. D’autres approches de MOT utilisent la représentation par par- ties afin d’améliorer le modèle d’apparence et de gérer les occultations entre les ob- jets. Cette représentation consiste à diviser l’objet cible en différentes régions (qui peuvent être de mêmes tailles ou de tailles différentes). D’où avoir plusieurs modèles d’apparence pour un seul objet cible. Dans Führ and Jung (2014), un objet cible est représenté par un ensemble de parties de tailles égales et qui couvrent toute la région de l’objet cible. Pour obtenir une représentation plus précise de l’objet cible, une stra- tégie de soustraction de l’arrière-plan est appliquée pour chaque objet cible. Ceci sert à éliminer certains pixels de bruit (par exemple les pixels de l’arrière-plan) qui appar- tiennent à la détection. Les parties sont définies par rapport à un axe où ses points sont : le point le plus bas et le point le plus haut de l’objet cible. Les parties sont par la suite mises en correspondance séparément en utilisant la distance Bhattacharyya entre leurs histogrammes. Dans Dihl et al. (2011), les auteurs proposent une division en grille rectangulaire de la région de l’objet cible. Ainsi, les parties qui sont mises en correspondance seront considérés comme des parties correctes qui peuvent aider à construire le nouveau gabarit de l’objet cible.

Le choix d’un modèle d’apparence est fortement lié au type des objets cibles, la relation entre les objets cibles, la variabilité des objets cibles dans le temps. Cette modélisation est fidèle au modèle original de l’objet associé. Plus la modélisation de l’objet est robuste, plus

elle peut s’adapter afin de prendre en considération les changements par rapport au modèle d’apparence original (luminosité, échelle, rotation, etc.). Le modèle d’apparence d’un objet cible peut être décrit en utilisant une caractéristique discriminante telle que : le format de l’objet (ou contour), la couleur de l’objet (Tang et al. (2014)), les propriétés de mouvement (Yang and Nevatia (2014a)), les propriétés géométriques (Yao et al. (2010)). Par ailleurs, un

objet peut être modélisé par plusieurs caractéristiques à la fois.