• Aucun résultat trouvé

Le suivi des objets `a partir de s´equences vid´eos a de nombreuses applications [11, 21, 76–78] dans le domaine de la vision par ordinateur dont : la vid´eo surveillance, le suivi et la reconnaissance de personnes, la cr´eation d’environnements intelligents, le suivi des v´ehicules, etc. Le suivi des objets permet de d´eterminer leurs trajectoires dans chaque image de la vid´eo et les donn´ees statistiques extraites peuvent ˆetre utilis´ees pour compter, surveiller et ´evaluer le mouvement de ces objets.

Dans cette section nous montrerons comment sont combin´ees les ´etapes de suivi cit´ees ci-dessus et nous pr´esenterons en d´etail diff´erents syst`emes de suivi. Parmi les syst`emes les plus r´epandus dans la litt´erature, nous avons choisi le syst`eme de suivi de personnes, de suivi de visages et de suivi de v´ehicules. Pour conclure nous aborderons les applications de suivi pour le domaine de la natation.

1.9. SYST`EMES DE SUIVI

1.9.1 Suivi de personnes

Le suivi des personnes fait l’objet de plusieurs ´etudes [11, 21, 79–81]. Dalal and Triggs [21] ont propos´e un syst`eme bas´e sur une description par HOG (Histogramme de Gradient Orient´e) et le classifieur par SVM (Support Vector Machine). Ce syst`eme n´ecessite une ´etape d’apprentissage o`u les vecteurs HOG sont extraits pour chaque classe, “personne” et “non personne”, afin d’entrainer le classifieur SVM. L’´etape de suivi se fait en parcourant chaque image de la vid´eo par une fenˆetre glissante, afin d’extraire les vecteurs HOG, puis en les classifiant dans l’une des deux classes apprise, `a savoir “personne” ou “non personne”.

Jiang et al [11] ont propos´e d’am´eliorer le syst`eme propos´e par Dalal et Triggs en fusionnant les histogrammes de gradient orient´e avec les histogrammes de couleurs (fi-gure 1.14). Dans le but de surmonter les probl`emes d’occultations partielles, ils ont propos´e d’analyser s´epar´ement la partie sup´erieure et la partie inf´erieure du corps hu-main. Dans leurs travaux, Wang et al [79] combinent les descripteurs HOG et LBP pour avoir une description locale bas´ee sur les contours et la texture des parties du corps humain. Ainsi ils obtiennent un syst`eme de suivi robuste aux occultations qui peut ˆetre combin´e aux algorithmes Mean-shift et SVM afin d’explorer les images de la vid´eo pour y localiser les personnes.

Figure 1.14 – Syst`eme de suivi de personnes bas´e sur la fusion des histogrammes de gradient orient´e et les histogrammes de couleurs [11]. Exemple de suivi de personnes dans trois images successives prise par une cam´era de surveillance. En rouge, les per-sonnes d´etect´ees et le nombre affich´e au dessus de la tˆete de chaque personne correspond `a son identifiant.

Le syst`eme de suivi propos´e par Li et al [80] est compos´e de deux ´etapes, la d´etection et le suivi. La d´etection de la tˆete et des ´epaules est assur´ee par la m´ethode de classi-fication Adaboost sur des descripteurs HOG. Chaque zone d´etect´ee est suivie par un filtre particulaire utilisant des descripteurs locaux mod´elisant l’apparence des cibles et offrant une robustesse dans les environnements encombr´es.

Enfin, en projetant ces applications de suivi de personnes sur notre sujet de suivi de nageurs, nous pouvons remarquer certaines ressemblances, notamment, la forme

globale de la cible `a suivre et les difficult´es li´ees aux occultations et aux d´eformations. En revanche, nous constatons une grande diff´erence en termes de profiles de mouvement et d’environnement de travail. En conclusion, nous pouvons tirer profit de quelques id´ees comme : les techniques adapt´ees au suivi, la fusion des diff´erentes techniques de suivi et la d´ecomposition de la cible en plusieurs zones.

1.9.2 Suivi de visages

La d´etection et le suivi de visages sont souvent associ´es aux applications de sur-veillance, de contrˆole d’acc`es et de reconnaissance biom´etrique faciale. Plusieurs ´etudes ont ´et´e publi´ees dans la litt´erature concernant ce domaine [16,23,76,82–84]. La m´ethode la plus r´epandue dans le domaine de la d´etection de visages et celle propos´ee par Viola et Jones [76] qui se base sur les caract´eristiques pseudo-Haar et le classifieur Adaboost. Cette m´ethode n´ecessite un apprentissage des classes “visage” et “non visage”. Le classi-fieur permet de s´electionner les caract´eristiques utiles et de s´eparer les exemples positifs “visage” des exemples n´egatifs “non visage” par cascade de d´ecision.

Katz et al [7] ont propos´e un syst`eme de d´etection de chute des personnes ˆag´ees bas´e sur le suivi de visage et l’analyse du mouvement. Ces informations leur permettent de d´etecter la chute et ainsi limiter les accidents. Comme le montre la figure 1.15 leur syst`eme de suivi de visage se d´ecompose en trois modules : l’initialisation par l’algorithme de Viola et Jones de d´etection du visage. Puis, un module de suivi bas´e sur la technique de corr´elation NL-JTC. Et pour finir, un module de mesure de confiance qui consiste en la comparaison de l’histogramme de couleurs de la cible d´etect´ee avec celui de la r´ef´erence. La mesure χ2 est utilis´ee pour la comparaison de ces histogrammes de couleurs et la g´en´eration d’une valeur de confiance. Celle-ci est compar´ee avec un seuil pour valider le suivi ou revenir `a la phase d’initialisation dans le cas d’un d´ecrochage du suivi.

Junxiang et al [16] ont propos´e une m´ethode de suivi de visage bas´e sur le filtre particulaire o`u le visage `a suivre est d´efini par un histogramme de couleur. Sachant que la couleur de la peau humaine est diff´erente de la couleur de la majorit´e des objets, Kuchi et al [85] propose de mod´eliser la couleur de la peau par une gaussienne dans le but de d´etecter le visage. Dans leurs travaux, Lee et al [82] extraient le visage de l’arri`ere-plan par la m´ethode de diff´erentiation d’image, o`u la soustraction de deux images successives permet d’extraire l’objet en mouvement i.e. le visage.

D’autres chercheurs ont propos´e des syst`emes de suivi multimodaux. Par exemple, Chuan Xu et al [23] ont d´evelopp´e un syst`eme de suivi bas´e sur les descripteurs LBP, qui d´ecrivent la texture, et l’information de couleur de la peau. Vadakkepat et al [83] ont propos´e un syst`eme de d´etection et de suivi pour les robots. Ce syst`eme se base sur les r´eseaux de neurones, la d´etection de peau et de visage ainsi que sur l’algorithme

1.9. SYST`EMES DE SUIVI

I0

Ii

Viola &

Jones1 IRef JTC IOut χ(H1, H2) χ <Seuil NON

OUI Initialisation Suivi Vid´eo Mesure de Confiance

Figure 1.15 – Syst`eme de suivi et d´etection de chutes des personnes ˆag´ees bas´e sur l’algorithme de Viola and Jones pour la d´etection de visage, NL-JTC pour le suivi et l’histogramme de couleurs pour l’´evaluation du suivi.

Mean-shift pour le suivi. Spors et Rabenstein [84] ont utilis´e l’Analyse en Composantes Principales pour localiser les yeux dans des r´egions de peau, d´etect´ees par segmentation. A partir de cette localisation, le visage est d´etect´e puis suivi en utilisant un filtre de Kalman.

Notons que les principes g´en´eraux de ces approches peuvent ˆetre utilis´es dans le cadre du suivi des nageurs. Pour ce faire, nous pouvons commencer par d´etecter la r´ef´erence initiale (tˆete du nageur) par des m´ethodes par apprentissage. Ensuite, nous pourrons suivre cette cible en utilisant des technique bas´ees sur la corr´elation NL-JTC, sur l’histogramme de couleurs, etc. Enfin, nous pourrons fusionner ces informations pour ´evaluer les performances des nageurs.

1.9.3 Suivi de v´ehicules

Les syst`emes de suivi de v´ehicules offrent des donn´ees brutes essentielles pour une large gamme d’applications telles que, la gestion et le contrˆole du trafic, le routage, la navigation et la s´ecurit´e routi`ere. Etant donn´e le grand int´erˆet de ce domaine beaucoup de recherches ont ´et´e faites pour am´eliorer ces syst`emes [77, 78, 86–89].

Dans ce type d’applications, les cam´eras utilis´ees sont souvent statiques, ce qui favorise les techniques de soustraction de fond connues pour leur simplicit´e et leur rapidit´e. Des variantes de ces techniques ont ´et´e propos´ees dans la litt´erature. Magee [77] a propos´e de mod´eliser l’arri`ere-plan par un mod`ele de m´elange de gaussiennes afin d’extraire les objets en mouvement, i.e. les v´ehicules. Un filtre de Kalman permet ensuite de pr´edire leur prochain emplacement. Dailey et al [86], quant `a eux, utilisent la diff´erenciation des images sur la vid´eo, pour extraire le fond, puis appliquent le d´etecteur

de contour de Sobel [90] pour localiser les v´ehicules plus pr´ecis´ement.

Long et al [87] proposent un syst`eme qui combine la soustraction de fond avec la comparaison des histogrammes de couleurs bas´ee sur la mesure de Bhattacharyya. Leur objectif est d’enlever l’interf´erence entre l’arri`ere-plan et la densit´e de probabilit´e de couleur des v´ehicules, comme le montre la figure 1.16. Avidan [88] a propos´e un syst`eme, appel´e SVT (Support Vector Tracking), assurant le suivi des v´ehicules par classifieur SVM.

Enfin, nous pouvons noter que ces approches de suivi de v´ehicules utilisent g´en´eralement des syst`emes de prise de vue statique. En particulier, nous constatons l’utilisation conjointe de la soustraction de fond et des histogrammes de couleurs permettant de gagner en robustesse. Cette id´ee est tr`es int´eressante pour notre cas de suivi de na-geurs car elle peut permettre d’appliquer des pr´etraitements sur l’image dans le but de faciliter et d’optimiser le suivi.

a) Original image b) Foreground area

c) Target vehicle d) Bhattacharyya coefficient and its 3D gradient Figure 4. Gradient vector of tracked vehicles

n

Figure 1.16 – Syst`eme de suivi des v´ehicules. La premi`ere ´etape est la soustraction de fond (b) de l’image originale (a). Ensuite, une comparaison des histogrammes de couleurs bas´ee sur le coefficient de Bhattacharyya (d) est faite pour d´etecter la cible (c).

1.9.4 Discussion

La pr´esentation de ses syst`emes de suivi permet d’avoir une vision globale de l’en-chainement des diff´erents modules constituant un syst`eme de suivi complet. Ainsi, nous nous inspirerons des diff´erentes optimisations propos´ees afin de d´evelopper un syst`eme de suivi de nageur performant. Celui-ci pourra contenir un module de pr´etraitement permettant de restreindre la zone de recherche, un module de suivi qui pourra ˆetre optimis´e par une fusion de descripteurs et un module de pr´ediction de mouvement.