• Aucun résultat trouvé

3.5 La morphologie oublieuse temporelle

3.7.4 R´egularisation Markovienne

Nous suivons le mod`ele qui a ´et´e utilis´e pour l’ex´ecution en temps r´eel sur diff´erentes architectures [CDLC96] et [LLMG99]. Ce mod`ele de Markov est bas´e sur l’´evaluation d’un champ de d´eplacement binaire (avant-plan / arri`ere-plan) e donnant un champ d’observation o, en maximisant un crit`ere de maximum a posteriori bay´esien : ´etant donn´e une r´ealisation du champ d’observation o = y, trouver la r´ealisation x du champ d’´etiquette de mouvement e qui maximise la probabilit´e conditionnelle P (e = x|o = y). Sous l’hypoth`ese que e est un champ de Markov, et un mod`ele probabiliste liant o et e, cela correspond `a trouver le champ de mouvement e qui minimise la fonction globale d’´energie d´efinie pour l’ensemble de pixels S comme suit :

U =X

s∈S

[Um(e(s)) + Ua(e(s), o(s))],

avec Um(e(s)) =

X

r∈V(s)

Ve(e(s), e(r)),

et Ua(e(s), o(s)) = 12[o(s)− Ψ(e(s))]2.

Um(e(s)) est appel´ee l’´energie du mod`ele et fournie la r´egularit´e spatio-temporelle

(1) (2)

(3) (4)

(5) (6)

(7) (8)

(9) (10)

Fig. 3.17 – R´esultat de l’estimation Σ-∆ avec r´egularisation Markovienne sur une s´equence de trafic urbain. (1) It (2) Mt. (3) Vt (affich´e avec un histogramme normalis´e).

(4) Dt(N=2). (5) Vt avec des oscillations simul´ees de la cam´era (histogramme normalis´e).

(6) Dt pour une cam´era oscillante (N=2). (7) D´etection apr`es r´egularisation Markovienne

(5 it´erations). (8) idem pour une cam´era oscillante. (9) Vt en utilisant le rebouclage (en

appliquant la mˆeme transformation que pour l’image (3). (10) D´etection en utilisant le rebouclage sur le calcul niveau pixel et r´egularisation Markovienne.

comme champ de Gibbs, o`u V est l’ensemble de voisins du pixel s, et les fonctions de potentiel Ve(e(s), e(r)) sont ´egales `a −βsr si e(s) = e(r), et +βsr si e(s) 6= e(r). Les βsr

sont des constantes positives, dont les valeurs d´ependent de la nature du voisinage. Nous utilisons une topologie spatio-temporelle uniforme 6-connect´ee avec 3 valeurs diff´erentes βs= 20 pour les 4 voisins spatiaux, βp = 10 pour le voisin pass´e, et βf = 30 pour le voisin

futur.

Ua(e(s), o(s)) est l’´energie d’ad´equation22et assure un certain niveau d’attachement

aux donn´ees d’entr´ees, aux observations o. Ce terme vient de la probabilit´e conditionnelle du champ d’observation o, le long du champ de mouvement e, en supposant que o(s) = Ψ(e(s)) + n(0, σ2), avec n(0, σ2) un bruit gaussien centr´e de variance σ2, ψ(e(s)) = 0 si

e(s) a la valeur de fond, et ψ(e(s)) = α si e(s) a la valeur de premier plan. les auteurs utilisent la diff´erence absolue entre deux trames cons´ecutives comme champ d’observation. Ils emploient une valeur constante pour α (20), et estiment σ2 en calculant la variance

spatiale des observations.

La minimisation de l’´energie globale U est obtenue par la relaxation d´eterministe appel´ee ICM : tous les pixels sont s´equentiellement mis `a jour, et chaque pixel s donne l’´etiquette e(s) correspondant `a la plus petite ´energie locale Um(e(s)) + Ua(e(s), o(s)).

Habituellement, au lieu d’une relaxation vraie, un nombre limit´e de balayages est ex´ecut´e (en g´en´eral 4). Cet algorithme est connu pour ˆetre tr`es sensible `a la qualit´e de la valeur initiale du champ estim´e de mouvement. Les auteurs (voir [DMLM05] et [Dum96]) utilisent un seuillage de l’observation (c.-`a-d. la diff´erence absolue entre deux trames cons´ecutives) comme ´evaluation initiale de e.

Dans notre algorithme, nous employons le mˆeme mod`ele, avec les exceptions suivantes : – pour l’observation o, nous employons ∆, la diff´erence entre le fond et la trame

courante ;

– nous employons la variance Σ-∆ V comme deuxi`eme champ d’observation, pour estimer localement le facteur de dispersion : (nv)2 est utilis´e au lieu de σ2 pour

pond´erer l’importance relative de Ua par rapport `a Um;

– l’initialisation de la relaxation Markovienne correspond `a la d´etection niveau pixel D.

Quels sont les avantages de cet algorithme compar´e au mod`ele Markovien original ?

D’abord, la diff´erence avec le fond Σ-∆ est plus robuste que la diff´erence trame `a trame, parce qu’elle combine l’information sur une grande p´eriode au lieu de deux trames. Elle est beaucoup moins sensible au probl`eme d’ouverture, qui rend difficile la d´etection de grandes zones homog`enes en mouvement. Elle d´epend ´egalement moins de la vitesse des

objets.

Ensuite, pour les mˆemes raisons, D est en g´en´eral un bien meilleur candidat pour initialiser la relaxation qu’une diff´erence de trame binaris´ee, parce qu’il est plus proche de la solution pr´evue. Il est `a noter que pour l’algorithme ICM, une fois l’initialisation calcul´ee, les autres param`etres du mod`ele ne sont pas critiques, et ont montr´e de bons comportements sur un large panel de s´equences.

Finalement, le param`etre de dispersion est calcul´e localement, aucun calcul global est n´ecessaire `a chaque trame. Ceci permet le calcul de l’algorithme entier en utilisant seulement la m´emoire locale, permettant de ce fait un parall´elisme spatial massif.

La Figure 3.17 pr´esente les r´esultats de l’estimation Σ-∆ avec r´egularisation Marko- vienne sur une s´equence de trafic urbain.

La sortie de la r´egularisation Markovienne est une estimation bas niveau du premier plan, comprenant les pixels saillants temporels. Afin d’am´eliorer la qualit´e de la d´etection et d’abaisser le taux de fausses alarmes, certains traitements de niveau plus ´elev´es sont n´ecessaires, en utilisant des calculs r´egionaux et globaux.

Les pixels sont regroup´es en r´egions repr´esentant les objets. Cela est habituellement r´ealis´e par la fusion de composantes connexes. Les objets r´esultants subissent alors un filtrage morphologique, qui peut rejeter certains objets sous des crit`eres de taille ou de forme. Un filtrage cin´ematique peut ´egalement ˆetre utilis´e afin de distinguer les objets dont le mouvement est pr´esent sur plusieurs trames cons´ecutives (par exemple voiture, pi´eton, . . . ).

En plus de la diminution du taux de fausses alarmes, l’int´erˆet du traitement au niveau global est de permettre une r´etroaction sur la d´etection de bas niveau. Un des exemples les plus imm´ediats est l’adaptation `a un changement soudain de fond : si un index global de confiance du fond (par exemple la superficie relative occup´ee par le premier plan) diminue en de¸ca d’un certain seuil, la d´ecision peut ˆetre prise de r´einitialiser le fond, afin d’abaisser le temps de r´eadaptation. Un autre exemple de rebouclage a ´et´e pr´esent´e et peut ˆetre ici aussi utilis´e.

Une ´etude approfondie de la comparaison des performances de l’algorithme Σ-∆ com- plet et de son utilisation avec une mod´elisation markovienne sur plusieurs architectures

(sur processeur PowerPC23 et sur la maille associative24) a ´et´e men´ee et montre

l’int´erˆet de l’algorithme dans un cadre plus g´en´eral [DMLM05].