Suivi basé sur l’algorithme Forward - THESE POUR OBTENIR LE GRADE DE DOCTEUR DE L’UNIVERSITE DE

présen-tons donc deux méthodes de suivi d’objet basées d’une part sur l’algorithme Forward et d’autre part sur l’algorithme de Viterbi.

5.4 Suivi basé sur l’algorithme Forward

Le suivi d’objet rigide comporte ici deux étapes : la prédiction d’une position approximative à l’aide d’un estimateur de mouvement simple, puis la recherche de la position exacte de l’objet en utilisant la CMC-MD/I générée lors de l’étape d’apprentissage.

On peut considérer la probabilité avec laquelle une CMCλgénère une observationO, soit P(O | λ). Ce problème peut être résolu à l’aide de l’algorithme Forward [Rab89]. Dans cette section, nous développons cette approche.

La méthode proposée consiste en trois étapes réalisées de manière itérative pour chaque image. Il est tout d’abord nécessaire de déterminer si l’objet a été perdu ou non. Une position approximative de l’objet est ensuite prédite. Finalement, la recherche de la position exacte de l’objet est effectuée.

5.4.1 Détermination de l’état de l’objet suivi

La première étape de l’algorithme consiste à vérifier si à l’instanttl’objet a été perdu ou non.

Pour cela, nous analysons les résultats de l’algorithme Forward pour une imageI_ten fonction des résultats obtenus à l’imageIt−1.

La zone analysée dans la trameI_test découpée en plusieurs fenêtresf_i(I_t)de tailleX_fenêtre× Y_fenêtre. L’algorithme Forward [Rab89] est appliqué sur chaque fenêtref_i(I_t)en considérant la CMC-MD/I générée lors de l’apprentissage. Il fournit un score globalP_i(I_t). On définit alors un indice pi(It) que le contenu de la fenêtrefi(It) soit généré par la CMC. Si on considérait que les indicespi(It)étaient identiques, on obtiendrait :

p_i(I_t)≈e

ln(Pi(It))

R×Xfenêtre×Yfenêtre (5.10)

oùRest la dimension de la CMC-MD/I. L’indicep_i(I_t)peut être considéré comme une norma-lisation par rapport à la taille et la dimension de l’observation. Plus la valeur dep_i(I_t)est élevée, mieux la fenêtref_i(I_t)représente l’objet et plus elle a de chances de contenir l’objet suivi.

5.4. Suivi basé sur l’algorithme Forward 89 Dans une image, nous cherchons donc la fenêtref_max(It)de plus fort indicep_max(It):

p_max(I_t) = max

i p_i(I_t) (5.11)

Idéalement, la valeur p_max(I_t) devrait être proche de 1 et tous les indices p_i(I_t) éloignés de cette valeur seraient associés à des fenêtres ne contenant pas l’objet à suivre. Cependant la représentation de l’objet par une image numérique s’accompagne d’erreurs liées à la qualité de l’acquisition (bruit, sensibilité au mouvement, etc.). Le processus doit donc considérer une certaine tolérance à ces erreurs. Ainsi, dans une image donnée It, l’indice de référence (noté p_ref(I_t)) ne sera pas considéré comme égal à 1, mais comme égal à l’indice associé à la fenêtre contenant l’objet dans la trame précédente, soitp_max(It−1).

A partir de cette mesure, il est possible de définir un intervalle [s_inf(I_t), s_sup(I_t)]en dehors duquel on considère que les indices n’assurent pas la présence de l’objet suivi :

s_inf(I_t) =α_inf×p_max(It−1) ; s_sup(I_t) =α_sup×p_max(It−1) (5.12) oùα_infetα_supsont deux coefficients permettant de qualifier la tolérance aux erreurs. Ces valeurs sont actuellement définies de manière empirique mais elles pourraient être obtenues par appren-tissage hors ligne ou analyse de l’erreur en ligne. Cet intervalle sera utilisé pour déterminer si un objet a été perdu.

Le traitement de la première image I₁ diffère du traitement des autres images puisqu’il est impossible de se baser sur les informations contenues dans les images précédentes pour déterminer l’intervalle [s_inf(It), s_sup(It)]. Dans ce cas, cinq fenêtres sont créées autour de la position initiale de l’objet, comme le montre la figure 5.3.

FIG. 5.3 – Fenêtres utilisées pour déterminerp_max(I₁)sur la première image I₁. La position a de l’objet b est considérée comme connue. Les 5 fenêtres sont représentées par les symboles c à g.

Actuellement, la taille de ces fenêtres est constante tout au long de la séquence d’images. On

5.4. Suivi basé sur l’algorithme Forward 90 peut remarquer qu’une des fenêtres recouvre partiellement chacune des 4 autres. Pour chaque fenêtrefi(I1), nous calculons l’indice associépi(I1). Nous sélectionnons ensuite l’indice maxi-malp_max(I₁)afin de définir l’intervalle[s_inf(I₂), s_sup(I₂)].

5.4.2 Prédiction d’une position approximative

Le positionnement des fenêtres repose sur une étape de prédiction de position. Cette étape est nécessaire pour éviter la perte d’un objet en déplacement ou une recherche trop coûteuse (car initialisée depuis une position erronée). Nous utilisons ici une méthode basée sur un modèle simple de mouvement afin de limiter le temps de calcul. De plus, le résultat obtenu n’est pas considéré comme définitif mais est utilisé comme initialisation pour le processus de recherche ultérieur.

Le modèle utilisé est donc basé sur les positions de l’objet dans les deux fenêtres précé-dentes :

( x_t=xt−1+c(xt−1−xt−2)

yt=yt−1+c(yt−1−yt−2) (5.13)

La position(xt, yt)est alors utilisée lors de l’étape de recherche de la position décrite plus loin.

L’hypothèse de vitesse constante se traduit parc = 1. Dans le cas où l’objet n’aurait pas été trouvé (notamment si sa vitesse n’est pas constante), plusieurs cas sont envisagés : soit une décélération (c= ¹₂), soit une accéleration (c= 2). Finalement, il est aussi possible que l’objet se soit arrêté. Ce mouvement nul entre les deux dernières images se traduit parc= 0.

Si l’objet est perdu dans tous les cas, on suppose qu’un phénomène d’occlusion temporaire est en cours et sa position estimée reste inchangée. Si le phénomène d’occlusion persiste sur un certain nombre d’images, le processus de suivi est arrêté et il est nécessaire d’effectuer à nouveau une détection des objets.

5.4.3 Recherche de la position exacte

En utilisant un de ces modèles de mouvement, nous obtenons une prédiction de la position approximative de l’objet à partir des images obtenues aux instantst−1ett−2. La recherche de la position exacte de l’objet est limitée à une fenêtre locale dont le centre est situé à la position (x_t, y_t).

Nous souhaitons utiliser l’algorithme Forward. Cet algorithme fournit un score qui permet de déterminer si l’objet est représenté ou non par l’observation analysée, mais ne permet pas

5.4. Suivi basé sur l’algorithme Forward 91 de localiser précisément l’objet dans une fenêtre. Nous avons développé une technique en deux étapes où l’algorithme Forward est appliqué sur des observations associées à chacune des sous-fenêtres considérées. Nous utilisons la notationf_i(I_t)introduite précédemment pour représenter les différentes sous-fenêtres analysées dans la trameI_tde la séquence vidéo.

Plus précisément, la fenêtre de recherche est divisée en 64 sous-fenêtres de dimension X_fenêtre ×Y_fenêtre pixels. Ensuite chaque sous-fenêtre est transformée en observation multidi-mensionnelle composée de trois composantes contenant un nombreX_fenêtre×Y_fenêtrede valeurs.

On obtient donc 64 chaînes d’observations.

La deuxième étape consiste à utiliser les observations pour déterminer la position exacte de l’objet. Pour cela on applique à chaque chaîne d’observations l’algorithme Forward dans sa version multidimensionnelle. Dans le but de s’assurer de l’indépendance des probabilités à la taille et à la dimension des observations, on utilise les valeursp_i(I_t)définies par l’équation (5.10) page 88. Cela permet notamment de gérer le cas où la taille des fenêtres d’analysef_i(I_t) et celle des images du corpus d’apprentissage sont différentes. Parmi les fenêtres caractérisées par une valeurp_i(I_t)comprise dans l’intervalle [s_inf, s_sup], on ne conserve que celles associées aux quatre valeurs p_i(I_t) les plus élevées. Si aucune valeur p_i(I_t) n’appartient à l’intervalle défini par[s_inf, s_sup], on considère que l’objet recherché n’a pas été trouvé et la recherche de la position exacte est initialisée à partir d’une autre estimation de la position. Si une seule valeur pi(It)appartient à l’intervalle [s_inf, s_sup], la position exacte de l’objet est déterminée comme le centre de la fenêtre pour laquelle cette valeurpi(It) a été obtenue. Enfin, si plusieurs valeurs p_i(I_t) sont comprises entre les deux seuils, la position C de l’objet est calculée comme une combinaison linéaire des centres des fenêtres pour lesquelles les valeursp_i(I_t)ont été obtenues :

C(I_t) =

La méthode présentée dans cette section a été testée sur des séquences d’images issues de retransmissions télévisées de matchs de football. Le but est de suivre le ballon sur toute la durée d’un plan. La plupart des tests ont été réalisés sur des séquences contenant plus d’une centaine d’images, comme le montre la figure 5.4. Les temps de calcul nécessaires sont de l’ordre de 80 millisecondes par image en considérant une architecture PC Pentium 4 candencé à 1700 MHz.

5.4. Suivi basé sur l’algorithme Forward 92 Même si la méthode utilise un modèle simple de mouvement à vitesse constante, les objets se déplaçant selon un mouvement non linéaire peuvent être suivis de manière précise, comme le montre la figure 5.5.

L’occlusion est un des problèmes les plus importants dans le domaine du suivi d’objet. Notre méthode est capable de suivre des objets temporairement cachés. Un exemple d’occlusion est présenté en figure 5.6.

En cas de présence dans la scène d’objets similaires à l’objet suivi, la méthode peut manquer de robustesse. Dans la figure 5.7, le ballon et la chaussette du joueur sont relativement similaires, et la position obtenue est donc incorrecte. Une étape de vérification basée sur des méthodes morphologiques serait nécessaire pour résoudre ce problème.

La méthode est également incapable de réaliser le suivi correctement lorsque la taille de l’objet à suivre est trop faible. Dans ce cas, des méthodes adaptées doivent être utilisées. Elles feront l’objet du chapitre 6.

Dans cette section, nous avons présenté une méthode de suivi par évaluation d’une CMC à l’aide de l’algorithme Forward. Au vu des résultats obtenus et des limitations de la méthode présentée dans cette section, l’utilisation d’une méthode plus complexe semble justifiée. Nous avons tenté de modéliser le suivi d’objet comme un problème de recherche du meilleur chemin d’états en utilisant l’algorithme de Viterbi.

FIG. 5.4 – Suivi d’un objet dans une séquence contenant plus de 100 images. La première image contient la position initiale de l’objet. Les autres images sont extraites à intervalles réguliers de la séquence vidéo.

FIG. 5.5 – Suivi d’un objet avec un mouvement non linéaire.

Dans le document THESE POUR OBTENIR LE GRADE DE DOCTEUR DE L’UNIVERSITE DE TOURS (Page 98-103)