• Aucun résultat trouvé

Mod` ele de vraisemblance

3.2 Choix du mod` ele

3.2.2 Mod` ele de vraisemblance

Le terme de vraisemblance d´ecrit la relation entre les 2 images du couple apr`es correction de la disparit´e. Nous pouvons donc commencer par proposer un mod`ele de formation pour chaque image, puis `a partir de cette formulation construire un mod`ele pour le couple st´er´eoscopique.

L a mod´elisation traditionnelle d’une image (i.e. de son intensit´e) consiste g´en´e- ralement `a consid´erer s´epar´ement l’´etape d’acquisition proprement dite (fonction de transfert du capteur) et l’´etape d’enregistrement (le codage sous forme digi- tale). On peut tout d’abord admettre que l’intensit´e correspondant `a un pixel est le r´esultat d’une moyenne spatiale, mod´elis´ee par une convolution entre l’intensit´e

ponctuelle de la sc`ene et une fonction de pond´eration propre au capteur (point spread function). La moyenne obtenue est elle-mˆeme transform´ee pour donner l’image calibr´ee (par exemple une valeur entre 0 et 255). Enfin, on peut consid´erer l’existence d’un bruit venant corrompre l’acquisition. C’est l’approche suivie par exemple par les fr`eres Geman dans [44]. Si on note I l’intensit´e initiale, ζ la fonc- tion mod´elisant le capteur, ψ la transformation due au codage et que l’on suppose le bruit η additif, l’intensit´e observ´ee Iobs s’´ecrit :

Iobs = ψ(I 6 ζ) + η (3.13)

o`u 6 d´esigne un produit de convolution.

En vision st´er´eoscopique, la mod´elisation s’enrichit du fait que l’on dispose de deux acquisitions de la mˆeme sc`ene. Si l’on accepte l’hypoth`ese lambertienne (la quantit´e de lumi`ere re¸cue par le capteur en provenance d’un point physique ne d´epend pas de l’angle d’observation [34, 48]), l’intensit´e I est la mˆeme pour les deux images I1 et I2. Si, de plus, les caract´eristiques des capteurs sont identiques,

on a pour un point physique de coordonn´ees (x, y, z) :

I1(u1, v1) = ψ (I(x, y, z) 6 ζ) + η1(u1, v1) (3.14)

I2(u2, v2) = ψ (I(x, y, z) 6 ζ) + η2(u2, v2) (3.15)

Les deux ´equations pr´ec´edentes traduisent le fait que les points images (u1, v1)

et (u2, v2) sont homologues. En g´eom´etrie ´epipolaire, on a donc v1 = v2 et u2 =

u1 + d(u1, v1). En notant alors (u, v) = (u1, v1), on obtient imm´ediatement :

I1(u, v)− I2(u + d(u, v), v) = ηu,v (3.16)

o`u ηu,v = η1(u, v)− η2(u + d(u, v), v).

Suivant cette description, le mod`ele du couple fait intervenir uniquement l’intensit´e r´esiduelle η des images. Choisir un mod`ele de vraisemblance revient donc `a choisir un mod`ele pour l’intensit´e r´esiduelle η, soit :

L(y|d) = πH(η) (3.17)

Au paragraphe 3.4, on ´etudie un extrait du couple st´er´eoscopique d’Aix-Mar- seille (figure 3.5) . La figure 3.6 repr´esente notamment l’intensit´e r´esiduelle obtenue `

a partir du couple et de la carte de disparit´e calcul´ee par corr´elation. On observe principalement un comportement de type bruit blanc, mais aussi des motifs or- donn´es (bords de bˆatiments, route...) issus du couple original, et quelques points aberrants dus `a des diff´erences d’intensit´e fortes entre les deux images du couple.

Mod`eles gaussiens

On suppose ici que le r´esidu η suit une distribution gaussienne, qui est sp´ecifi´ee par sa moyenne ml et sa matrice de covariance Cl, soit :

L(y|d) = πH(η)∝ |Cl|−21exp  1 2(η− ml) C−1 l (η− ml)  (3.18) Se pose alors la question de la structure spatiale du r´esidu η, et donc du mod`ele pour Cl.

Une approche habituelle, que l’on retrouve dans [18] et dans une certaine me- sure dans [26, 6] (avec la diff´erence que ces deux derniers mod´elisent explicitement les occlusions en ajoutant un terme sp´ecifique), est de consid´erer un bruit gaussien non corr´el´e. La matrice C−1l de l’´equation 3.18 est alors diagonale, et si l’on note σl2 la variance, la fonction de vraisemblance s’´ecrit :

L(y|d) = πH(η)∝ 1 σn l exp  1 l2  u,v (ηu,v− ml)2  (3.19) Ce mod`ele est acceptable lorsque l’intensit´e r´esiduelle ne pr´esente que peu de structure spatiale. C’est g´en´eralement vrai dans le cas d’images obtenues avec le satellite SPOT (cf. figure 3.6), o`u les d´eformations g´eom´etriques sont assez faibles, et les occlusions rares.

Dans certaines situations, le mod`ele de bruit blanc pour le r´esidu η s’av`ere trop simpliste. Ainsi, lorsque les d´eformations g´eom´etriques sont importantes, la diff´erence d’intensit´e entre les deux images, mˆeme apr`es correction de la disparit´e, pr´esente des motifs ordonn´es, qui correspondent aux contours des objets de la sc`ene (cf. figure 3.6). On constate alors que le terme r´esiduel η est spatialement corr´el´e.

On peut essayer de tenir compte de cette structure spatiale par un choix appro- pri´e de la covariance Cl. Cependant, le terme de vraisemblance doit ˆetre ´evalu´e fr´equemment ; on a donc int´erˆet `a choisir un mod`ele o`u la matrice inverse C−1l est creuse (nulle en dehors de certaines diagonales) afin de diminuer le temps de cal- cul. Un exemple est un mod`ele de champ markovien gaussien de voisinage r´eduit aux 4 plus proches voisins (ordre 1). De tels mod`eles sont utilis´es couramment en analyse d’images [44, 8, 53, 68, 120]. L’int´erˆet des champs de Markov gaussiens est que l’on mod´elise directement la matrice de covariance inverse, le choix de la taille de voisinage revenant `a sp´ecifier le nombre de diagonales non nulles.

Notons ∂uv l’ensemble des couples (u + 1, v), (u−1, v), (u, v +1), (u, v −1) formant le voisinage du pixel (u, v). Le mod`ele choisi pour η s’exprime en fonction des lois conditionnelles (cf. annexe C) :

πH (ηu,v|ηs,t, (s, t)= (u, v)) = πH(ηu,v|ηs,t, (s, t)∈ ∂uv)

= |∂uv| 2πσl exp  −|∂uv| 2 l  ηu,v− ml ρl |∂uv|  (s,t)∈∂uv(ηs,t− ml) 2 (3.20)

|∂uv| d´esigne le cardinal de ∂uv : 4 en g´en´eral, sauf sur les bords (3) et dans

les coins (2). ρl est un param`etre de d´ependance spatiale. Il est possible de te- nir compte d’une anisotropie en introduisant deux coefficients ρlx et ρly distincts suivant que l’on consid`ere des voisins situ´es sur la mˆeme ligne ou sur la mˆeme colonne. Remarquons que dans ce mod`ele, la variance conditionnelle, ´egale `a σl2

|∂uv|,

est proportionnelle au nombre de voisins. Il est ´egalement important de noter que la sp´ecification du mod`ele est enti`erement d´ependante du pas de discr´etisation utilis´ee pour calculer la disparit´e. Si l’on change de pas, l’hypoth`ese markovienne risque de ne plus ˆetre valable, ou du moins faut-il calculer les param`etres ρl et σl correspondants.

La loi spatiale se d´eduit des lois conditionnelles (les d´etails sont pr´esent´es en an- nexe C). On obtient alors l’expression suivante pour le terme de vraisemblance :

L(y|d) = πH(η) ∝ exp(− 1 2l  u,v |∂uv|(ηu,v − ml)2 −ρl σl2  u,v u,v− ml)(ηu+1,v − ml) −ρl σl2  u,v u,v− ml)(ηu,v+1− ml)) (3.21)

o`u les sommes sont prises sur les indices faisant partie du champ de d´efinition. Dans la suite, on utilise autant que possible l’expression g´en´erale 3.18 pour ´

etudier ces deux mod`eles. Le premier mod`ele (´equation 3.19) est appel´e GMF-0, et le second (´equation 3.21) GMF-1 (pour Gaussian Markov Field d’ordre 0 et 1 respectivement).

Mod`ele de m´elange de distribution

Les mod`eles gaussiens pr´ec´edents ne permettent pas de d´ecrire le cas de r´e- sidu aberrant, i.e. de diff´erences fortes d’intensit´e entre deux points homologues. En effet, d`es que les surfaces ne sont plus lambertiennes (existence de r´eflexions sp´eculaires par exemple), ou lorsque les conditions d’´eclairement varient entre les deux acquisitions, on ne peut plus supposer que l’intensit´e initiale I est la mˆeme pour les 2 images I1 et I2. Ce ph´enom`ene est accentu´e lorsque les deux images sont

prises `a des dates espac´ees (ce qui peut ˆetre le cas pour les capteurs embarqu´es sur les satellites SPOT ant´erieurs `a SPOT 5), auquel cas certains d´etails (les champs par exemple) ont chang´e. Une mani`ere de prendre en compte ces valeurs aber- rantes est de supposer que le r´esidu est compos´e de 2 types de points : le premier correspond `a un bruit d’acquisition, comme dans les deux mod`eles pr´ec´edents, tandis que le second est un terme parasite, rendant compte des fortes valeurs. Ce type de mod`eles est appel´e mod`ele de m´elange.

3.18). Pour le terme parasite, on peut supposer que n’importe quelle valeur de la forme I1(u1, v1)− I2(u2, v2) peut apparaˆıtre. Ce terme suit donc la loi de la diff´e-

rence des images. En supposant pour simplifier que pour ces points, les intensit´es I1 et I2 sont ind´ependantes et suivent chacune une loi gaussienne, la loi de la dif-

f´erence est elle-mˆeme gaussienne, avec pour moyenne la diff´erence des moyennes et pour variance la somme des variances. Sous ces hypoth`eses, le r´esidu peut ˆetre mod´elis´e par un m´elange de 2 lois gaussiennes φ1 et φ2.

Notons pl1 la proportion de points de loi φ1, et pl2 celle des points de loi φ2, avec la condition pl1 + pl2 = 1. L a densit´e du m´elange pour un pixel est obtenue comme moyenne pond´er´ee de φ1 et φ2. Comme nous supposons de plus l’ind´epen-

dance spatiale (ce qui est certes simplificateur), le mod`ele de vraisemblance prend l’expression :

L(y|d) = πH(η)∝



u,v

pl1φ1(ηu,v) + pl2φ2(ηu,v) (3.22)

Ce mod`ele est proche du mod`ele utilis´e dans [102] et pr´esent´e au paragraphe 2.2.2, dans lequel la loi gaussienne est perturb´ee par un terme de loi uniforme. Le choix d’une loi gaussienne pour mod´eliser le terme parasite est assez bien adapt´e dans le cas des images SPOT. Notons enfin que l’estimation des proportions pl1 et pl2 est d´elicate, car la classification des points du r´esidu dans l’une ou l’autre des cat´egories est inconnue. Ce probl`eme est trait´e aux paragraphes 3.2.3 et 3.3. Dans la suite, on utilise l’abr´eviation MIXT (en r´ef´erence `a mixture) pour d´esigner ce mod`ele de m´elange.