Détection de l’objet appris - THESE POUR OBTENIR LE GRADE DE DOCTEUR DE L’UNIVERSITE DE TOURS

FIG. 5.9 – Suivi d’un objet en présence de phénomènes d’occlusion.

FIG. 5.10 – Suivi incorrect d’un objet dans une scène contenant des objets aux caractéristiques similaires.

ce chapitre fournissent des résultats relativement similaires. Elles sont toutes deux capables de suivre des objets dans des séquences vidéo composées de plus de 100 trames mais échouent lorsque des objets aux caractéristiques similaires sont présents dans la scène. Contrairement à nos intuitions, la seconde méthode (basée sur l’algorithme de Viterbi), quoique plus complexe, ne permet pas d’améliorer les résultats obtenus. Par contre, elle est caractérisée par des temps de calcul plus élevés.

5.6 Détection de l’objet appris

Dans les deux sections précédentes, nous avons utilisé le résultat de l’apprentissage pour réaliser un suivi de l’objet appris dans une séquence vidéo. Ce suivi suppose que la position de l’objet soit connue dans la première image. Pour cela, nous proposons une étape de détection de l’objet à suivre, qui ne sera effectuée que sur la première image de chaque plan.

Nous présentons ici encore deux méthodes, basées respectivement sur les algorithmes For-ward et de Viterbi. Ces deux méthodes peuvent être assimilées à des adaptations à l’analyse de l’image complète, des méthodes de suivi précédentes.

5.6. Détection de l’objet appris 97

5.6.1 Détection basée sur l’algorithme Forward

La méthode de suivi par l’algorithme Forward est basée principalement sur le découpage de l’image en sous-fenêtresfi de tailleXfenêtre ×Yfenêtre, puis sur l’application de l’algorithme Forward sur chaque sous-fenêtref_i. La méthode peut s’appliquer sur l’image entière. Le nombre de fenêtres de tailleX_fenêtre×Y_fenêtrecréées est alors plus élevé.

Pour chaque fenêtre créée, l’algorithme Forward est appliqué à l’observation associée afin de fournir une probabilitéP(O |λ). On ne s’intéresse qu’auxkplus élevées probabilités four-nies par l’algorithme Forward. La valeur de k dépend du rapport entre la taille des images du corpus d’apprentissage et la taille des fenêtres d’analyse. Plus ce rapport est élevé, plus le nombre de fenêtres pouvant contenir l’objet sera important. Le paramètreksera alors ajusté en conséquence. Si on considère des sous-fenêtres dont la taille est proche de la taille des images du corpus d’apprentissage, on peut affirmer qu’au maximum 4 fenêtres peuvent être associées à un objet à détecter et on choisitk = 4. Dans ce cas, les 4 probabilités associées seront rela-tivement faibles. Evidemment, il est possible qu’une unique fenêtre contienne l’objet à suivre.

La probabilité associée à cette fenêtre sera alors élevée.

Cependant, le choix d’une valeur k si faible se traduit par une sensibilité importante au bruit. Nous choisissons donc une valeur plus élevée (k = 20 déterminé empiriquement) afin de garantir que l’objet est représenté par certaines des fenêtres f_i considérées. Il nous faut maintenant analyser ces fenêtres pour déterminer précisément la position de l’objet. En partant de connaissances a priori sur la taille de l’objet, nous éliminons les ensembles connexes de 5 fenêtres ou plus parmi les fenêtres conservées, considérant que la taille de l’objet détecté est trop élevée. Cette approche permet de ne considérer que des objets dont la taille est relativement similaire à celle de l’objet appris. Elle est particulièrement efficace pour supprimer les grands ensembles connexes de fenêtres. Cependant elle n’est pas aussi robuste dans le cas d’ensembles connexes contenant un faible nombre de fenêtres.

Nous avons donc envisagé une seconde technique, plus robuste, qui effectue une analyse locale des fenêtres associées auxk probabilités les plus élevées. Un processus de vérification est effectué itérativement, depuis la probabilité la plus élevée jusqu’à lak^ième probabilité. Ce processus s’arrête lorsqu’une fenêtre (ou observation) O associée à la probabilité concernée vérifie la condition suivante. Dans le voisinage3×3de la fenêtreO, on noteO_v celle qui est caractérisée par la probabilité la plus élevée. Puisque l’objet ne peut occuper qu’un ensemble spatial de2×2fenêtres, nous analysons le symétrique deO par rapport àO_v. Si cette fenêtre est associée à une probabilité appartenant auxkplus élevées, alors la taille de l’objet détecté ne correspond pas à celle de l’objet appris.

5.6. Détection de l’objet appris 98 La méthode de détection présentée ici a été testée sur différentes images. Malgré l’analyse de toute l’image, le temps de calcul reste relativement faible. Cependant, la qualité de la détection dépend fortement de la nature de l’environnement, comme le montre la figure 5.11.

FIG. 5.11 – Détection d’un objet par l’algorithme Forward : correcte au sein d’un environnement simple (à gauche), incorrecte au sein d’un environnement complexe (à droite).

Nous avons donc envisagé de représenter la détection d’un objet appris par un problème plus complexe, celui de la détermination du meilleur chemin d’états, résolu par l’algorithme de Viterbi.

5.6.2 Détection basée sur l’algorithme de Viterbi

La méthode est une adaptation de la méthode de suivi à la recherche dans une image entière.

Nous utiliserons ici les chemins d’étatsQ(I_app)de référence. Ces chemins d’états ne sont calcu-lés qu’une seule fois, hors ligne. Nous découpons l’image en différentes fenêtres (ou observa-tions) et sur chacune d’entre elles nous appliquons l’algorithme de Viterbi avec la CMC-MD/I générée lors de l’apprentissage.

Le chemin d’étatsQ associé à chaque fenêtre est alors comparé avec les chemins d’états Q(I_app)de référence. Contrairement à la section 5.5, les chemins d’étatsQ etQ(I_app) sont ici de même longueur. La comparaison, effectuée à l’aide de l’algorithme de Wagner et Fischer, se traduit par un coût de passage d’un chemin d’états à l’autre. Pour chaque chemin d’états Q, le nombre de distances calculées est égal au nombre d’imagesI_app présentes dans le corpus d’apprentissage. Nous ne conservons alors pour chaque chemin d’états Q que celui de coût minimal.

La recherche de la position de l’objet s’effectue comme dans le cas précédent, mais ici les probabilités (décroissantes) sont remplacées par les mesures de distance (croissantes).

De même que dans le cas du suivi, les résultats obtenus avec cette méthode (figure 5.12) sont relativement similaires à ceux obtenus avec la méthode basée sur l’algorithme Forward.

5.7. Comparaison avec un algorithme de template matching 99

Dans le document THESE POUR OBTENIR LE GRADE DE DOCTEUR DE L’UNIVERSITE DE TOURS (Page 106-109)