• Aucun résultat trouvé

approches sont souvent adaptées à des séquences acquises avec une caméra fixe (statique) ou en mouvement (dynamique). Nous présentons les principales techniques dans la prochaine section.

3.2 Approches classiques

Nous présentons les techniques les plus couramment utilisées en considérant d’abord le cas d’une caméra statique, puis celui d’une caméra dynamique.

3.2.1 Caméra statique

Dans le cas où la caméra effectuant l’acquisition est fixe, la séparation du fond et des objets peut être obtenue par différentes techniques de faible complexité algorithmique. Ces techniques sont basées sur la comparaison des images successives de la séquence. Plus précisément, la cohérence de l’intensité ou de la couleur d’un pixel au cours du temps influe directement sur la classification qu’on lui donne : fond ou objet.

Ainsi, une première approche suppose que l’arrière-plan est connu initialement via la dispo-nibilité d’une image de référenceIref. Cette image représente uniquement la scène, aucun objet n’étant présent. Pour une image donnéeIt, la classification d’un pixelPt(x, y)en objet ou en fond résulte de la comparaison avec l’image de référence :

Pt(x, y)classé en

S étant un seuil de tolérance à fixer empiriquement ou après apprentissage. Différents auteurs [Ros98, Sah88] ont proposé des méthodes pour choisir la valeur du seuilS. La figure 3.1 page 45 montre le résultat obtenu avec cette méthode.

Cependant, il est possible dans certains cas qu’aucune image de référence ne soit disponible.

La séparation des objets et du fond s’effectue alors par comparaison d’images successives, en considérant un intervalle de temps∆tplus ou moins important. La classification d’un pixel est alors donnée par :

3.2. Approches classiques 45

FIG. 3.1 – Séparation du fond et des objets par comparaison avec une image de référence : image analysée (à gauche), image de référence (au centre), et résultat (à droite).

FIG. 3.2 – Séparation du fond et des objets par comparaison d’images successives : image analysée (à gauche), image précédente (au centre), et résultat (à droite).

De même que pour la méthode précédente, nous illustrons cette technique par la figure 3.2.

Les deux techniques décrites précédemment considèrent un modèle figé de l’arrière-plan.

Ce modèle est insuffisant dans certains cas tels que les changements d’illumination au cours de la journée ou encore l’arrêt durable d’un objet initialement en mouvement. Afin de gérer ce type de situation, des modèles plus robustes ont été proposés. Ces modèles sont dits adaptatifs et évoluent au cours du temps pour intégrer les éléments nouveaux. Ainsi Stauffer et Grimson pro-posent dans [Sta99] de modéliser chaque niveau d’un pixel comme un mélange de gaussiennes afin de le classer en objet ou en fond, tandis que Elgammal et al. [Elg00] préfèrent utiliser un modèle non-paramétrique. Young et al. comparent dans [You99] différents modèles statistiques pour résoudre ce problème.

Une autre approche consiste en l’ajout d’un post-traitement à l’une des deux techniques dé-crites par les équations (3.1) et (3.2). Ainsi, Martins et al. [Mar99] intègrent des filtres et opéra-tions de morphologie mathématique afin d’améliorer le résultat. La méthode obtenue s’exécute en temps réel sur une architecture standard.

Finalement, la séparation des objets et du fond peut aussi être obtenue en considérant la scène en 3-D et non plus en 2-D. Il est dans ce cas nécessaire de considérer un capteur

sup-3.2. Approches classiques 46 plémentaire, comme un matériel de profondeur [Gor99] ou un système de plusieurs camé-ras [Iva00]. Nous n’aborderons pas ce type d’approches dans notre étude.

Les principaux travaux menés dans le cadre de la séparation du fond et des objets se sont focalisés sur les séquences vidéo acquises à l’aide d’une caméra statique. Si la caméra effectuant l’acquisition des images est en mouvement, d’autres techniques doivent être employées.

3.2.2 Caméra dynamique

Dans le cas d’une caméra statique, certaines des méthodes décrites permettent de satisfaire trois des quatre contraintes énoncées dans la section 3.1 :Crapidité, Ccouleur, etCillumination. La der-nière contrainte Cmouvement, quant à elle, n’a fait l’objet que d’un nombre limité d’études. La séparation des objets et du fond dans le cas d’une caméra dynamique est le plus souvent obte-nue par l’utilisation de la méthode que nous décrivons ici.

La méthode est composée de trois étapes successives : estimation du mouvement de la ca-méra, compensation de ce mouvement, et utilisation d’une approche pour caméra statique.

Tout d’abord, il est nécessaire d’estimer le mouvement de la caméra, ce qui revient à es-timer le mouvement global observé dans la séquence. De nombreuses méthodes permettent de résoudre ce problème. On pourra par exemple se référer aux travaux d’Odobez et Bou-themy [Odo95] dans le cas de séquences vidéo non-compressées ou à ceux de Tan et al. [Tan00]

dans le cas de séquences vidéo compressées. On trouvera dans [Kon00] et dans [Wan02] une présentation détaillée des modèles et estimateurs de mouvement. On pourra également se référer à l’ouvrage de Tziritas et Labit [Tzi94].

Une fois le mouvement de la caméra estimé, une technique de compensation du mouve-ment doit être utilisée [Ell99,Son00,Zhe02]. La compensation du mouvemouve-ment permet d’annuler les effets dans l’image du mouvement de la caméra. Les images obtenues peuvent donc être considérées comme acquises avec une caméra fixe [Beu02].

La dernière étape consiste alors en l’utilisation d’une méthode pour caméra fixe, telle que celles présentées dans la section précédente. Là encore, la qualité du résultat peut être améliorée en utilisant un modèle plus robuste ou en ajoutant des post-traitements.

Parmi ces trois étapes, la dernière peut être exécutée en temps réel. Les deux premières, quant à elles, nécessitent un nombre important de calculs qui empêche une exécution en temps réel sur une architecture informatique standard. En effet, l’estimation et la compensation de mouvement sont deux traitements connus pour leur complexité algorithmique. Même si les différentes méthodes présentées dans la littérature pour gérer le cas d’une caméra dynamique

3.3. Une approche multirésolution 47