R´egularisation Markovienne - La morphologie oublieuse temporelle

3.5 La morphologie oublieuse temporelle

3.7.4 R´egularisation Markovienne

Nous suivons le modèle qui a été utilisé pour l’exécution en temps réel sur différentes architectures [CDLC96] et [LLMG99]. Ce modèle de Markov est basé sur l’évaluation d’un champ de déplacement binaire (avant-plan / arrière-plan) e donnant un champ d’observation o, en maximisant un critère de maximum a posteriori bayésien : étant donné une réalisation du champ d’observation o = y, trouver la réalisation x du champ d’étiquette de mouvement e qui maximise la probabilité conditionnelle P (e = x|o = y). Sous l’hypothèse que e est un champ de Markov, et un modèle probabiliste liant o et e, cela correspond à trouver le champ de mouvement e qui minimise la fonction globale d’énergie définie pour l’ensemble de pixels S comme suit :

U =X

s∈S

[Um(e(s)) + Ua(e(s), o(s))],

avec Um(e(s)) =

r∈V(s)

Ve(e(s), e(r)),

et Ua(e(s), o(s)) = _2σ12[o(s)− Ψ(e(s))]2.

Um(e(s)) est appelée l’énergie du modèle et fournie la régularité spatio-temporelle

(1) (2)

(3) (4)

(5) (6)

(7) (8)

(9) (10)

Fig. _{3.17 – Résultat de l’estimation Σ-∆ avec régularisation Markovienne sur une} séquence de trafic urbain. (1) It (2) Mt. (3) Vt (affiché avec un histogramme normalisé).

(4) Dt(N=2). (5) Vt avec des oscillations simulées de la caméra (histogramme normalisé).

(6) Dt pour une caméra oscillante (N=2). (7) Détection après régularisation Markovienne

(5 it´erations). (8) idem pour une cam´era oscillante. (9) Vt en utilisant le rebouclage (en

appliquant la même transformation que pour l’image (3). (10) Détection en utilisant le rebouclage sur le calcul niveau pixel et régularisation Markovienne.

comme champ de Gibbs, où _{V est l’ensemble de voisins du pixel s, et les fonctions de} potentiel Ve(e(s), e(r)) sont égales à −βsr si e(s) = e(r), et +βsr si e(s) 6= e(r). Les βsr

sont des constantes positives, dont les valeurs dépendent de la nature du voisinage. Nous utilisons une topologie spatio-temporelle uniforme 6-connectée avec 3 valeurs différentes βs= 20 pour les 4 voisins spatiaux, βp = 10 pour le voisin passé, et βf = 30 pour le voisin

futur.

Ua(e(s), o(s)) est l’´energie d’ad´equation22et assure un certain niveau d’attachement

aux données d’entrées, aux observations o. Ce terme vient de la probabilité conditionnelle du champ d’observation o, le long du champ de mouvement e, en supposant que o(s) = Ψ(e(s)) + n(0, σ2_{), avec n(0, σ}2_{) un bruit gaussien centré de variance σ}2_{, ψ(e(s)) = 0 si}

e(s) a la valeur de fond, et ψ(e(s)) = α si e(s) a la valeur de premier plan. les auteurs utilisent la diff´erence absolue entre deux trames cons´ecutives comme champ d’observation. Ils emploient une valeur constante pour α (20), et estiment σ2 _{en calculant la variance}

spatiale des observations.

La minimisation de l’énergie globale U est obtenue par la relaxation déterministe appelée ICM : tous les pixels sont séquentiellement mis à jour, et chaque pixel s donne l’étiquette e(s) correspondant à la plus petite énergie locale Um(e(s)) + Ua(e(s), o(s)).

Habituellement, au lieu d’une relaxation vraie, un nombre limité de balayages est exécuté (en général 4). Cet algorithme est connu pour être très sensible à la qualité de la valeur initiale du champ estimé de mouvement. Les auteurs (voir [DMLM05] et [Dum96]) utilisent un seuillage de l’observation (c.-à-d. la différence absolue entre deux trames consécutives) comme évaluation initiale de e.

Dans notre algorithme, nous employons le même modèle, avec les exceptions suivantes : – pour l’observation o, nous employons ∆, la différence entre le fond et la trame

courante ;

– nous employons la variance Σ-∆ V comme deuxi`eme champ d’observation, pour estimer localement le facteur de dispersion : (_nv)2 _{est utilis´e au lieu de σ}2 _pour

pond´erer l’importance relative de Ua par rapport `a Um;

– l’initialisation de la relaxation Markovienne correspond `a la d´etection niveau pixel D.

Quels sont les avantages de cet algorithme compar´e au mod`ele Markovien original ?

D’abord, la différence avec le fond Σ-∆ est plus robuste que la différence trame à trame, parce qu’elle combine l’information sur une grande période au lieu de deux trames. Elle est beaucoup moins sensible au problème d’ouverture, qui rend difficile la détection de grandes zones homogènes en mouvement. Elle dépend également moins de la vitesse des

objets.

Ensuite, pour les mêmes raisons, D est en général un bien meilleur candidat pour initialiser la relaxation qu’une différence de trame binarisée, parce qu’il est plus proche de la solution prévue. Il est à noter que pour l’algorithme ICM, une fois l’initialisation calculée, les autres paramètres du modèle ne sont pas critiques, et ont montré de bons comportements sur un large panel de séquences.

Finalement, le paramètre de dispersion est calculé localement, aucun calcul global est nécessaire à chaque trame. Ceci permet le calcul de l’algorithme entier en utilisant seulement la mémoire locale, permettant de ce fait un parallélisme spatial massif.

La Figure 3.17 présente les résultats de l’estimation Σ-∆ avec régularisation Marko- vienne sur une séquence de trafic urbain.

La sortie de la régularisation Markovienne est une estimation bas niveau du premier plan, comprenant les pixels saillants temporels. Afin d’améliorer la qualité de la détection et d’abaisser le taux de fausses alarmes, certains traitements de niveau plus élevés sont nécessaires, en utilisant des calculs régionaux et globaux.

Les pixels sont regroupés en régions représentant les objets. Cela est habituellement réalisé par la fusion de composantes connexes. Les objets résultants subissent alors un filtrage morphologique, qui peut rejeter certains objets sous des critères de taille ou de forme. Un filtrage cinématique peut également être utilisé afin de distinguer les objets dont le mouvement est présent sur plusieurs trames consécutives (par exemple voiture, piéton, . . . ).

En plus de la diminution du taux de fausses alarmes, l’intérêt du traitement au niveau global est de permettre une rétroaction sur la détection de bas niveau. Un des exemples les plus immédiats est l’adaptation à un changement soudain de fond : si un index global de confiance du fond (par exemple la superficie relative occupée par le premier plan) diminue en de¸ca d’un certain seuil, la décision peut être prise de réinitialiser le fond, afin d’abaisser le temps de réadaptation. Un autre exemple de rebouclage a été présenté et peut être ici aussi utilisé.

Une ´etude approfondie de la comparaison des performances de l’algorithme Σ-∆ com- plet et de son utilisation avec une mod´elisation markovienne sur plusieurs architectures

(sur processeur PowerPC23 _{et sur la maille associative}24_{) a été menée et montre}

l’intérêt de l’algorithme dans un cadre plus général [DMLM05].

Dans le document Détection et analyse du mouvement sur système de vision à base de rétine numérique (Page 148-152)