M´ethodes probabilistes - REVUE DE LITT´ ERATURE

CHAPITRE 3 REVUE DE LITT´ ERATURE

3.13 M´ethodes probabilistes

Compte tenu la difficulté dans la décision d’une correspondance, les méthodes probabi-

listes sont devenues les choix naturels. Nous n’en listons que quelques une ici.

3.13.1 M´ethode de propagation de croyance

Comme la m´ethode de propagation de croyance demande beaucoup d’espace pour la

sauvegarde de messages, la méthode utilisée est généralement limitée aux images à basse

définition. Yang et al. ont proposé un algorithme qui demande un espace constant de mémoire.

Cet algorithme peut s’op´erer en temps lin´eaire, et ce, en fonction du nombre de pixels contenus

dans l’image. La demande de mémoire est indépendante du nombre de niveaux de disparité

L. Le temps d’ex´ecution est aussi ind´ependant de L si on exclut le temps de calcul des

donn´ees. (voir Yang et al., 2010).

3.13.2 Approche probabiliste des images en haute d´efinition

Geiger et al. ont présenté un travail intéressant. Avec une approche de point de support

et probabiliste, ils ont obtenu une tr`es bonne performance sur les images en haute d´efinition

avec CPU. Les points de support sont les pixels ayant une correspondance robuste grˆace `a

leur texture et unicité, obtenus par la concaténation des réponses horizontales et verticales

de filtre Sobel d’une fenêtre de 9 × 9. Les points de support sont ensuite employés pour créer

une maille 2D avec l’algorithme de triangulation de Delaunay. Une distribution pr´eliminaire

est calculée à l’aide des disparités des points de support et la maille triangulée. (voir Geiger

et al., 2010)

Prenons S = {s

, . . . , s

} comme un ensemble de points de support. O = {o

, . . . , o

}

est un ensemble d’observations d’image. o

(g)n

et o

(d)n

d´esignent les observations dans les images

de gauche et de droite respectivement. (voir Geiger et al., 2010, p. 5)

Supposons que les observations {o

(g)n

, o

(d)n

} et les points de support S sont conditionnel-

lement indépendants étant donné ses disparités d

, la distribution jointe peut ˆetre factoris´ee

`a : (voir Geiger et al., 2010, p. 5)

p(d

|S, o

(g)n

) est une distribution pr´eliminaire et p(o

(d)n

|o

(g)n

, d

) est comme vraisemblance

d’image. La Figure 3.12 est un modèle graphique décrit par l’équation 3.47. (voir Geiger

et al., 2010, p. 5)

Figure 3.12 Mod`ele gaphique d’une approche probabiliste (voir Geiger et al., 2010, p. 5)

La distribution pr´eliminaire p(d

|S, o

(g)n

) peut prendre la forme d’une combinaison d’une

distribution uniforme et une distribution gaussienne ´echantillonn´ee. (voir Geiger et al., 2010,

p. 6)

p(o

(d)_n

|S, o

(g)_n

) ∝











γ + exp(−(d

− µ(S, o

(g) n

))

2σ

) si |d

− µ| < 3σ ∨ d

∈ N

0 sinon

(3.48)

µ(S, o

(g)n

) est exprimée comme un group de fonctions linéaires qui interpolent les disparités

en employant l’algorithme de triangulation Delaunay sur les points de support.

La vraisemblance d’image peut ˆetre ´ecrite comme une distribution laplacienne contrainte :

(voir Geiger et al., 2010, p. 6)

p(o

(d) n

|o

(g)n

, d

) ∝











exp(−β ||f

_n(g)

− f

_n(d)

||) si



u

v

g n



 =



u

+ d

v

d n





0 sinon

(3.49)

o`u f

n(g)

et f

n(d)

sont vecteurs de caract´eristique de l’image de gauche et celle de droite respec-

tivement. β est une constante. (voir Geiger et al., 2010, p. 6)

La carte de disparité peut être calculé par : (voir Geiger et al., 2010, p. 7)

d

∗_n

= argmax p(d

|o

(g)n

, o

(d) 1

, . . . , o

(d)

o`u o

, . . . , o

d´esignent toutes les observations de l’image de droite sur la ligne ´epipolaire de

o

. La distribution postérieure peut être factorisée comme : (voir Geiger et al., 2010, p. 7)

p(d

|o

(g)n

, o

(d)1

, . . . , o

(d)N

, S) ∝ p(d

|S, o

(g)n

) p(o

(d)1

, . . . , o

|o

(g)n

, d

)

(3.51)

Tandis que : (voir Geiger et al., 2010, p. 7)

p(o

(d)₁

, . . . , o

d_N

|o

(g)_n

, d

) ∝

X

i=1

p(o

(d)_i

|o

(g)_n

, d

)

(3.52)

Alors nous avons une fonction d’´energie : (voir Geiger et al., 2010, p. 7)

E(d) = β ||f

(g)

_{− f}

(d)

_{(d)|| − log[γ + exp(−}[d − µ(S, o

(g)

)]

2σ

)]

(3.53)

f

(d)

_{(d) est le vecteur de caract´eristique au pixel (u}

(g)

_{− d, v}

(g)

_{). (voir Geiger et al., 2010,}

p. 7) Principalement parce que cette m´ethode ´evite de faire la mise en correspondance par

pixel et elle s’appuie sur la fiabilit´e des points de support, la qualit´e et la performance sont

bonnes, meilleures que plusieurs m´ethodes. (voir Geiger et al., 2010)

3.13.3 Mod`ele de Markov cach´e

Le modèle de Markov caché (MMC) joue un rôle important dans l’apprentissage par

machine. La carte de disparit´e est un ensemble de distance des pixels correspondants dans

deux images. Il arrive souvent qu’un point ne soit pas ind´ependant des autres points dans

une image. La forme et le changement de forme selon le point de vue doivent être considérés.

Par convention, nous supposons que chaque pixel d´epend du pixel de gauche sur une ligne de

disparité. Nous aurons un modèle de MMC pour chaque ligne horizontale de pixels illustrés

dans la Figure 3.13

Figure 3.13 Un MMC horizontal concernant le probl`eme de disparit´es des images

La variable d

repr´esente la disparit´e de pixels optimale dans une ligne de carte de dis-

concernées. La probabilité jointe des variables observées et cachées est comme ci-dessous :

P ({o}, {d}) =

Y

t=1

P (o

|d

)

Y

t=1

P (d

t+1

|d

)P (d

)

Un MMC a cinq ´el´ements essentiels : (voir Rabiner, 1989, pp. 260–261).

1. N, le nombre d’états dans le modèle. Un ensemble d’états individuels est

S = {S

, S

, . . . , S

}, un ´etat au moment t est d

.

2. M, le nombre de symboles distincts par ´etat. Un ensemble de symboles individuels est

O = {o

, o

, . . . , o

}.

3. La distribution probabiliste d’´etats est d´efinie comme A = {a

} o`u a

= P [d

t+1

=

S

| d

= S

], 1 ≤ i, j ≤ N.

4. La distribution probabiliste de symboles d’observation dans l’´etat j, B = {b

(k)}, o`u

b

(k) = P [o

`a t | o

= S

], 1 ≤ j ≤ N, 1 ≤ k ≤ M.

5. La distribution initiale des ´etats π = {π

} o`u π

= P [d

= S

], 1 ≤ i ≤ N.

Le mod`ele est normalement not´e λ = (A, B, π) (voir Rabiner, 1989, pp. 260–261).

L’algorithme Viterbi (voir Viterbi, 1967, pp. 264–265) est employ´e dans le d´ecodage de

code convolutif utilisé dans la télécommunication. Il est aussi couramment utilisé dans la

reconnaissance de parole. La complexit´e de calcul est pass´ee de simple recherche exhaustive

M

_{`a NM}

_{(voir Snyder et Qi, 2004, p 25).}

Déjà en 1975, Baker a présenté un système de compréhension de la parole nommé DRAGON

en employant le MMC (voir Baker, 1975).

3.13.4 Modèle de généralisation de MMC

Le MMC pr´esent´e dans la sous-section 3.13.3 suppose que sur chaque ligne de balayage,

un pixel de la carte de disparit´e influence la valeur du pixel voisin direct `a droite et l’obser-

vation. En réalité, un pixel d’une image dépend des valeurs voisines autour. Une première

généralisation de MMC est de passer de connexion de gauche à droite à celle grillée. La

Figure 3.14 montre cette g´en´eralisation et une partie de passage de message en employant la

m´ethode de graphe de facteur de Kschischang et al.(voir Kschischang et al., 2001).

Figure 3.14 G´en´eralisation de MMC

Supposons qu’une ex´ecution de propagation de croyance passe de gauche `a droite et de

haut en bas et le point x(i, j) est l’étape actuelle. La première étape de passage de message

est :

m

f(i−1,j−1)→x(i,j−1)

=

X

v{x(i,j−1)}

m

x(i−1,j−1)→f(i−1,j−1)

f

(i−1,j−1)

(x[i, j − 1])

= m

x(i−1,j−1)→f(i−1,j−1)

f

(i−1,j−1)

(x[i, j − 1])

m

f(i,j−2)→x(i,j−1)

=

X

v{x(i,j−1)}

m

x(i,j−2)→f(i,j−2)

f

(i,j−2)

(x[i, j − 1])

= m

x(i,j−2)→f(i,j−2)

f

(i,j−2)

(x[i, j − 1])

(3.54)

La deuxi`eme ´etape est :

m

x(i,j−1)→f(i,j−1)

= m

f(i−1,j−1)→x(i,j−1)

m

f(i,j−2)→x(i,j−1)

m

f(i+1,j−1)→x(i,j−1)

m

y(i,j−1)→x(i,j−1)

m

x(i,j−1)→f(i+1,j−1)

= m

f(i−1,j−1)→x(i,j−1)

m

f(i,j−2)→x(i,j−1)

m

f(i,j−1)→x(i,j−1)

m

y(i,j−1)→x(i,j−1)

La troisi`eme ´etape est :

m

f(i−1,j)→x(i,j)

=

X

v{x(i,j)}

m

x(i−1,j)→f(i−1,j)

f

(i−1,j)

(x[i, j])

= m

x(i−1,j)→f(i−1,j)

f

(i−1,j)

(x[i, j])

m

f(i,j−1)→x(i,j)

=

X

v{x(i,j)}

m

x(i,j−1)→f(i,j−1)

f

(i,j−1)

(x[i, j])

= m

x(i,j−1)→f(i,j−1)

f

(i,j−1)

(x[i, j])

(3.56)

La quatri`eme ´etape est :

m

x(i,j)→f(i,j)

= m

f(i−1,j)→x(i,j)

m

f(i,j−1)→x(i,j)

m

f(i+1,j)→x(i,j)

m

y(i,j)→x(i,j)

m

x(i,j)→f(i+1,j)

= m

f(i−1,j)→x(i,j)

m

f(i,j−1)→x(i,j)

m

f(i,j)→x(i,j)

m

y(i,j)→x(i,j)

(3.57)

Après cette étape, le flux passe de droite à gauche et de bas en haut.

Cette généralisation de MMC est en fait un modèle de champ aléatoire de Markov (MRF).

La m´ethode de passage de message est appel´ee la propagation de croyance. Nous pouvons

espérer avoir un bon résultat avec ce modèle. Et la propagation de coûts ressemble à la

méthode d’agrégation des coûts de SGM (semi-global matching). Toutefois, le temps de calcul

sera élevé et l’augmentation de précision au détriment du temps de calcul n’est pas le travail

principal de cette thèse. Nous allons essayer de rapprocher cette méthode avec une méthode

de multiples passes de MMC qui a une impl´ementation rapide en GPGPU.

Dans le document Traitement et analyse d'images stéréoscopiques avec les approches du calcul générique sur un processeur graphique (Page 71-76)