La mod´elisation markovienne - Etat de l’art de la d´etection du mouvement 95 ´

3.3 Etat de l’art de la d´etection du mouvement 95 ´

3.3.2 La mod´elisation markovienne

L’approche markovienne en traitement d’images est très utilisée dans des domaines aussi variés que la restauration d’images bruitées, la segmentation d’objets, la modélisation de textures ou la synthèse d’images texturées, la classification d’images, l’extraction de contours, ou encore la détection du mouvement et l’analyse de scènes dynamiques. La modélisation markovienne, associée aux techniques d’estimation bayésienne, est en réalité une approche statistique qui permet de prendre en compte diverses informations contex- tuelles. Ces informations généralement issues des relations statistiques existent entre un point et son voisinage et s’expriment sous la forme d’interactions spatiales ou tempo- relles, formant ainsi un ensemble de connaissances a priori. En considérant le mouvement comme une variation de l’intensité des pixels dans l’image et comme un phénomène aléatoire, nous pouvons modéliser le mouvement comme un événement probabiliste [BL93] [MHC94] [Hen96] [CDLC96].

D´efinition 17 Une suite d’images al´eatoire X est une fonction de Ω × Z3 _{× N dans}

{0, . . . , 1}, o`u :

– Ω est l’univers probabiliste, – Z3 _{est l’espace discret,}

– N est le temps discret,

– N _{∈ N est le nombre de niveaux de gris.}

Pour s∈ Z2_{× N, X(s) : Ω → {0, . . . , 1} est la variable al´eatoire au site s.}

Pour w _{∈ Ω, X(ω) : N → {0, . . . , N} est la suite d’images correspondant à l’évènement} ω.

S_{= Z}2_{× N est l’ensemble des sites et V = {0, . . . , N} est l’ensemble des niveaux des gris,} et E = VS

l’ensemble des suites d’images.

Chaˆıne de Markov

Définition 18 (chaˆıne de Markov) Une suite (Xn)n de variables aléatoires à valeurs

dans E est une chaˆıne de Markov si et seulement si, pour tout n∈ N, pour tout x0, . . . , xn

de E tels que P (X0= x0, . . . , Xn = xn) > 0, et pour tout xn+1 de E :

1. P (Xn+1 = xn+1|X0 = x0, . . . , Xn = xn) = P (Xn+1= xn+1|Xn= xn)

et _{∀k > 0 et ∀n > 0, P (X}n+k+1= x|Xn+k = x′) = P (Xn+1 = x|Xn= x′)

2. P (X0 = x0, X1 = x1, . . . , Xn= xn) = qi0pi0i1pi1i2...pin−1in

∀i, j, n ∈ N, pij = P (Xn+1 = xj|Xn= xi) ⇒          ∀i, qi ≥ 0 et n X i=1 qj = 1 ∀i, j, pij ≥ 0 et n X k=1 pik = 1

Une chaˆıne de Markov est caractérisée par la donnée, d’une part pij, 1 ≤ i, j ≤ r,

que l’on appelle les probabilités de transition de l’état i à l’état j, et d’autre part des probabilités initiales qi, 1≤ i ≤ r. Les pij forment la matrice de transition de la forme :

p =      p11 p12 . . . p1n p21 . . . p2n .. . ... pn1 . . . pnn     

telle que ∀i, j, pij ≥ 0 et n

k=1

pik = 1

Remarque : Soient q(n)_i = P (Xn = xj|X0 = xi), la probabilit´e (inconditionnelle) que

la chaˆıne de Markov soit dans l’´etat i `a l’instant n, et soit p(n)_ij = P (Xn= xj|X0 = xi), la

probabilité conditionnelle de passer de xi à xj en n étapes.

Ainsi, q_i(n)= n X j=1 qjp(n)ij ,∀i = 1, . . . , n 1. _{∀k ≥ 0, ∀i, j = 1, . . . , n, p}(n)_ij = P (Xn+k = Ej|Xk = Ei) 2. _{∀n ≥ 0, ∀ij = 1, . . . , r,} p(1)_ij = pij p(n+1)_ij = r X k=1 pikpkj(n) Propri´et´e 4 P (Xn+1 = Ein+1, . . . , Xn+k = Ein+k|X0 = Ei0, . . . , Xn = Ein) = pinin+1. . . pin+k−1in+k = P (X1 = Ein+k, . . . , Xk = Ein+k|X0 = Ein) [AG92]

Application `a la d´etection du mouvement

L’approche markovienne est pertinente dans le cadre de la détection du mouvement car il n’est pas rare qu’une scène abrite des régions (ou des pixels) ou le mouvement est plus souvent observés (plus probable). Moyennant l’hypothèse de caméra fixe et d’éclairement quasi constant de la scène, il existe un lien entre objets mobiles et changements temporels de la fonction de luminance. Cela conduit naturellement à prendre comme observation la valeur absolue de la dérivée temporelle de la fonction de luminance I(x, y, t) qui est approchée numériquement par une différence entre les instants t et dt :

Y (x, y, t) =|I(x, y, t) − I(x, y, t − dt)|

Par ailleurs, les ´etiquettes pertinentes dans le cas de la d´etection sont les suivantes :

I(x, y) =

0 fixe 1 mobile

L’application de la modélisation markovienne à la détection du mouvement se fait en trois étapes :

1. une étape de modélisation (utilisation des champs de Markov) 2. une étape de simulation (utilisation des champs de Gibbs)

3. une ´etape d’optimisation (utilisation des algorithmes ICM6 _{ou recuit simul´}_e)

Champ al´eatoire

X : Ω → VS _o`_{u S est l’ensemble des sites (ou des pixels) d’une image et V est}

l’ensemble des valeurs des sites.

∀w ∈ Ω, Xw : S→ V est la r´ealisation d’un champ al´eatoire.

∀s ∈ S, Xs: Ωs → V est la variable al´eatoire du pixel

V ={0, 1} = {fixe, mobile} et S = Z3 _{ou S = Z}_{× N}

topologie sur S : relation de d´ependance des v.a. Xs

Champ de Markov

Un champ de Markov est défini relativement à un voisinage. A ce voisinage sont associées des cliques, définies comme étant des sous-ensembles de sites voisins du site s, incluant ce site et tels que deux sites de la clique soient toujours mutuellement voisins.

(1) (2)

Fig. 3.3 – La forme des différents cliques sur Z2 _{en 4-connexité (1) et en 8-connexité (2)}

Définition 19 Le champ aléatoire X est un champ de Markov relativement au système au voisinage de _{V si et seulement si pour tout s ∈ S et pour tout x}r ∈ V :

P (Xs= xs / Xr= xr , r 6= s) = P (Xs = xs / Xr = xr , r ∈ Vs)

La seconde condition induit une propriété de localité : la valeur d’une étiquette en un site ne dépend pas des étiquettes de tous les autres sites de l’image, mais uniquement des étiquettes des sites voisins.

Le champ des étiquettes est estimé au sens du critère du Maximum A Posteriori (MAP). Il conduit à la recherche de la configuration la plus probable du champ d’étiquettes par maximisation de la probabilité conditionnelle des étiquettes relativement aux observa- tions. Ainsi, pour détecter le mouvement, nous recherchons la réalisation la plus probable d’un champ de Markov dit ”caché”, à partir d’un champ connu dit ”observation”.

Champ de Gibbs

D´efinition 20 (Mesure de Gibbs) X : Ω_{→ E}S _{est un champ de Gibbs s’il existe une}

fonction U(´energie), U : ES _{→ R telle que :}

P (X = x) = e

−U (x)

avec Z = X

x∈VS

e−U (x) représente une constante de normalisation, nommée fonction de partition ou mesure de Gibbs (ou de Boltzmann) d’énergie U.

Propriété 5 (Théorème de Hammersley-Clifford) Soit X un champ aléatoire à valeur dans E tel que _{∀x ∈ E, P (X = x) > 0. X est un champ de Markov relativement au} système de voisinage V si et seulement si sa distribution P (X = x) est une mesure de Gibbs associée à _V.

U(x) est la fonction d’énergie associée au modèle a priori et s’exprime sous la forme : U(x) =X

c∈C

Vc(x)

o`u C d´esigne l’ensemble des cliques de l’image. Chaque terme Vc(e) est une fonction de

potentiel élémentaire associée à une clique c donnée. La Figure 3.4 présente les paramètres intervenant dans le calcul de la fonctionnelle d’énergie dans le cas du 10-voisinage spatio- temporel (8 voisins spatiaux et 2 voisins temporels).

D´efinition 21 (Mod`ele de Potts) Vx(s, r) = −β_+βsr si x(s) = x(r) sr si x(s)6= x(r) une clique c = (s,r) t s t−1 t+1 r r r r r r r r r r un pixel central s un voisin r

Fig. 3.4 – Les param`etres intervenant dans le calcul de la fonctionnelle d’´energie dans le cas du 10-voisinage spatio-temporel (8 voisins spatiaux et 2 voisins temporels).

Ces potentiels sont définis spécifiquement vis-à-vis du problème à résoudre, la seule contrainte à respecter est que chacun de ces potentiels ne dépende que des sites de la

clique c = (s, r). Ces fonctions de potentiel permettent d’introduire des contraintes sur les solutions recherchées dont celle d’homogénéité spatiale du champ des étiquettes7_.

U(x) = Um(x) + Ua(x, y)

Le terme Um est appelé énergie du modèle. Il exprime une hypothèse de régularité par

des potentiels qui mesurent la disparit´e.

Um(x) = X s∈S X r∈VS Vx(s, r) ≃ X s X r ±βsr

Le terme Uaest appelé énergie attachée aux données ou énergie d’adéquation. Il mesure

un lien significatif entre le résultat de la segmentation des données du problème. Son rôle consiste à éviter que le terme de régularisation représenté par l’énergie du modèle n’éloigne trop le résultat de l’initialisation.

Ua(x, y) = _2σ12 X s∈S (y(s)− Ψ(s))) avec Ψ(s) = 0 si x(s) = 0 fixe βsr si x(s) = 1 mouvement On suppose P (X = x) = e−Um(s)_Z s et P (Y = y|X = x) = e−Uα(x,y)

Zr (mod`ele de bruit liant

X et Y ).

alors ArgminxU(x) = argmaxxP (X = x)P (Y = y|X = x) = argmaxxP (X = x|Y =

x) crit`ere Bayesien du Maximum a priori

Conclusion

La minimisation de la fonction énergie est un problème non trivial car cette fonction est a priori non convexe. Les principales techniques sont les algorithmes de Recuit-simulé qui offrent de bons résultats mais dont le coût de calcul est élevé et les algorithmes ICM qui sont des algorithmes de relaxation déterministe. Ces algorithmes sont sous- optimaux, puisqu’ils n’autorisent des changements d’étiquettes que si ceux-ci engendrent une diminution d’énergie. Ils ne garantissent donc pas de trouver le minimum global et sont donc très dépendants de l’initialisation [Dum96] [BL93]. De plus, les modèles d’étiquetage existants sont fondés sur certaines hypothèses restrictives, par exemple : le déplacement de l’objet mobile entre images voisines doit être supérieur à sa taille ou,

dans le contraire, cet objet ne doit pas être uniforme. De tels algorithmes sont complexe à intégrer dans un circuit comme celui de la rétine numérique. Nous verrons dans la suite du manuscrit comment toutefois envisager une implantation, notamment avec l’aide de fonctions asynchrones dont on disposerait dans les futurs modèles de rétines[Gie05].

Dans le document Détection et analyse du mouvement sur système de vision à base de rétine numérique (Page 103-109)