Fusion interéchelle basée sur le contexte

2.3 Description d’une méthode de segmentation de texture par modèle d’arbre

2.3.4 Fusion interéchelle basée sur le contexte

L’amélioration de la segmentation « brute » va être réalisée en modélisant les dépen-dances interéchelle entre les carrés dyadiques. Comme les carrés dyadiques à fine résolu-tion ont pour parents des carrés à résolurésolu-tion plus grossière, les carrés dyadiques sont liés à travers les échelles. On peut donc s’aider de l’information trouvée dans les carrés de résolution grossière pour déterminer la décision dans les carrés à plus fine résolution. Les informations contenues dans les voisins du carré parent seront également utilisées comme aide à la décision. Ces données sont modélisées à travers un « vecteur de contexte ». L’uti-lisation de ce vecteur de contexte permet également de prendre en compte le fait que deux coefficients voisins dans une sous-bande ne sont pas entièrement indépendants.

La dépendance interéchelle est modélisée par un nouvel arbre (Arbre des Labels) avec une chaîne de Markov à une dépendance entre les niveaux. À partir des données de cet arbre, une estimation du label de chaque carré est faite (par une estimation Maximum a posteriori, MAP), de manière récursive jusqu’au niveau du pixel.

2.3.4.1 Segmentation bayésienne

Dans un contexte bayésien, chaque label de classe c_iva être traité comme une variable aléatoire Ci prenant ses valeurs dans {1, 2, . . . , Nc}, Nc étant le nombre de classes. Étant donné la distribution a posteriori p(ci|x) de Ci étant donné X, la classification Maximum A Posteriori(MAP) du carré dyadique d_i correspond au label de classe qui maximise la distribution a posteriori

c^{M AP}_i := arg max

ci∈{1,2,...,Nc}p(ci|x). (2.57) La distribution a posteriori peut être écrite, en appliquant la règle de Bayes,

p(ci|x) = ^{f (x}_{f (x)}^|ci)p(ci⁾. (2.58) Si on note dj l’ensemble des carrés dyadiques à l’échelle j, (dj contient l’information sur l’image x entière), on peut écrire l’équation précédente sous la forme :

p(c^j_i|d^j) = ^{f (d}

j|c^ji)p(c^j_i)

f (dj) ^. (2.59)

La résolution de cette équation étant difficilement réalisable en pratique, elle va être sim-plifiée. Pour cela, un arbre probabiliste basé sur la structure en quadtree des carrés dya-diques va être construit pour modéliser cette probabilité a posteriori. Le modèle d’arbre

des labels résultant va capturer les dépendances interéchelles entre les blocs dyadiques et leurs labels de classe pour permettre une décision de fusion bayesienne multiéchelle. 2.3.4.2 Modèle de l’image avec des labels de classe cachés

Plutôt que de modéliser les statistiques jointes des carrés dyadiques Di directement, Choi choisit de modéliser les statistiques du label de classe C_i associé. On suppose que ce label C_i contrôle les propriétés texturales du carré D_i.

Soit Cj l’ensemble des labels de classe à l’échelle j. Étant donné Cj = cj, tous les Dj i sont indépendants :

f (d^j|c^j) = ^Y i

f (d^j_i|c^ji). (2.60) On obtient donc l’équation suivante :

p(c^j|dj) = ^{f (d} j|cj)p(cj) f (dj) ⁼ p(cj) f (dj) Y i f (d^j_i|c^ji). (2.61)

Cette équation reste difficile à résoudre sauf si la distribution jointe p(c_i) peut être sim-plifiée. Pour cela, il va être supposé que la distribution jointe des labels de classe Cj

i est entièrement déterminée par les Cj−1

i à l’échelle précédente (plus grossière). Ceci, com-biné à l’assomption que D_iest conditionnellement indépendant de tous les C_kétant donné Ci (pour i 6= k), fait que Cj−1

i , Cj

i et Di forment une chaîne de Markov. Cette heuris-tique modélise les dépendances interéchelles entre les labels de classe. Ainsi, étant donné C_i^j−1 = c^j−1_i , les Cj

i à l’échelle j sont indépendants, et on peut écrire : p(c^j|c^j−1) = ^Y

p(c^j_i|c^j−1). (2.62)

Calculer p(cj

i|cj−1) reste encore difficile. Le contexte va permettre de simplifier les calculs. Pour chaque carré dyadique D_i, avec le label de classe caché Cj

i, est assigné un vecteur de contexte vj

i qui est formé des informations de cj−1. Le triplet vi → Ci → Di forme une chaîne de Markov à une dépendance. v_icontient suffisamment d’informations sur cj−1 pour que, étant donné v_i, Cj

i et Dj

i soient indépendants de tous les autres Cj k et Dj k. On peut écrire : p(c^j|v^j) = ^Y i p(c^j_i|vi^j). (2.63) Comme D_i est indépendant de v_i étant donné C_i, on peut écrire :

p(cj|dj, vj) = ^{f (d} j|cj)· p(cj|vj) f (dj|vj) ⁼ 1 f (dj|vj) Y i [f (d^j_i|c^ji)· p(c^ji|vi^j)], (2.64) soit f (c^j_i|d^ji, v_i^j)∝ f(di^j|c^ji)· p(c^ji|vi^j)]. (2.65) Ici, f(dj

i|c^ji) sont les probabilités des carrés dyadiques di, étant donné les différentes va-leurs de classe C_i, qui sont calculées lors de la segmentation « brute » pour chaque modèle de texture. p(ci|vi) donne l’information sur les C_i^j fournis par les Cj−1

k par l’intermédiaire de v_i.

2.3.4.3 Arbre des labels de contexte

Il faut faire un compromis entre la complexité du contexte et la précision du modèle. v_i^jpeut potentiellement être une fonction de tous les Cj−1

k à l’échelle j −1. Choi choisit un modèle plus simple. Le vecteur de contexte comportera deux valeurs : la valeur du label du père et la valeur majoritaire des labels des huit voisins du père. Ceci permet de prendre en compte une fenêtre centrée sur dj

i de trente six carrés dyadiques. Cette organisation est appelée arbre des labels de contexte.

Si on a N_c textures différentes, on a donc N_v := N2

c vecteurs de contexte différents : vi ∈ {v1, . . . vNv}.

Comme les p(cj

i|vi^j) à l’échelle j dépendent des C_k^j−1 à l’échelle j − 1, f(cj

i|d^ji, v_i^j) sera évalué et maximisé dans une approche multiéchelle qui fusionnera les probabilités du modèle HMT f(dj

i|c^ji) en utilisant l’arbre des labels p(c^j_i|v^ji).

Algorithme EM de fusion multiéchelle La fusion est réalisée comme suit : on démarre à l’échelle j − 1 qui est suffisamment grossière pour que la segmentation « brute » par ML, ˆcj−1

M L, soit fiable, statistiquement parlant. On utilise cette segmentation comme étant la décision MAP, ˆcj−1

M AP. Ceci permet de déterminer vj

i à l’échelle j. f(dj

i|c^ji) est connu (il est calculé lors du calcul des vraisemblances du HMT). L’estimée au sens du maximum de vraisemblance de p(ci|vi) est celle qui maximise la vraisemblance d’une image étant donné les contextes vi:

f (x|v^j) = ^Y J(i)=j Nc X l=1 f (d^j_i|ci = l)· p(ci = l|vi). (2.66)

p(ci|vi) est choisi, au sens du maximum de vraisemblance en moyennant les valeurs sur l’image entière x.

p(ci|vi) est déterminé en appliquant la règle de Bayes : p(ci|vi) = ^p(vi|ci)· p(ci)

p(vi) ^. (2.67)

En posant : e_j,m := pc_i(m) et αj,v_k,m:= p(vi = vk|ci = m), l’ensemble des probabili-tés P := {ej,m, αj,vk,m} peut être calculé avec un algorithme EM sur l’arbre des labels de contexte. Étape E : p(ci = m|d^ji, v_i^j) = ^ej,mαj,vi,mf (d^j_i|ci = m) Nc X l=1 ej,lαj,vi,lf (d^j_i|ci = l) (2.68) Étape M : ej,m= ¹ 22j X i p(ci = m|vi^j, d^j_i) (2.69) α_j,v_k_,m= ¹ 22j · ej,m X i avec v_i^j=vk

Les étapes E et M sont appliquées successivement jusqu’à convergence.

La classification de Bayes basée sur le contexte permet ainsi de calculer le label qui maxi-mise la distribution contextuelle a posteriori p(ci|di, vi).

2.3.4.4 Amélioration de la segmentation aux frontières des régions

Afin de mieux détecter et localiser les frontières entre les régions segmentées, Fan et Xia ont proposé d’utiliser d’autres vecteurs de contexte [Fan et Xia, 2001]. En plus d’uti-liser un vecteur rassemblant la valeur du père et des voisins du père, les auteurs utilisent un vecteur contenant les valeurs des voisins du fils, et un autre rassemblant les valeurs du père, des voisins du père et des voisins du fils (cf. figure 2.11).

FIG. 2.11 – Les différents vecteurs de contextes utilisés par Fan et Xia [Fan et Xia, 2001]. Les carrés dyadiques utilisés sont : a) les voisins du fils, b) les voisins du père et le père, c) le père, les voisins du père, les voisins du fils.

Ces différents vecteurs sont utilisés séquentiellement. Le résultat de segmentation avec un vecteur de contexte sert d’image « d’initialisation » (segmentation « brute ») au vecteur de contexte suivant.

Dans le document Approches multiéchelles pour la segmentation de très grandes images : application à la quantification de biomarqueurs en histopathologie cancérologique. (Page 79-82)