• Aucun résultat trouvé

B.3 Outils statistiques

B.3.3 La courbe ROC

La caract´eristique de fonctionnement du r´ecepteur ou, en anglais, Receiver Ope-rating Characteristic est une mesure de la performance d’un test/classification bi-naire. On repr´esente la mesure ROC sous la forme d’une courbe qui donne le taux de vrais positifs, ou sensibilit´e, en fonction du taux de faux positifs, ou ”1-sp´ecificit´e”. L’aire sous la courbe ROC (AUC) repr´esente la probabilit´e que, pour deux indi-vidus, un positif et un n´egatif, la classification donne un score plus ´elev´e au positif. Un test performant est alors d’autant plus performant que l’aire sous la courbe ROC est plus grande : figure B.1.

Cependant, r´esumer la courbe ROC en donnant seulement l’AUROC correspon-dant ferait perdre beaucoup d’informations, et il est essentiel de repr´esenter la courbe en donnant l’AUROC.

B.4 Evaluation multiobservateurs´

En imagerie m´edicale, la v´erit´e terrain ne peut ˆetre obtenue qu’au moyen d’ana-lyses histologiques sur des tissus en ex vivo, ce qui n’est pas r´ealisable dans la plupart des ´etudes.

0 0.2 0.4 0.6 0.8 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1−Spécificité Sensibilité ROC 1 ROC 3 ROC 2

FigureB.1 – Exemple de 3 courbes ROC, donnant 3 performances diff´erentes (dans l’ordre d´ecroissant) ROC1 > ROC2 > ROC3.

Sur les images r´eelles, le contourage manuel, effectu´e par un radiologue expert reste une r´ef´erence rapidement disponible et proche de la r´ealit´e.

Il est cependant bien connu et d´emontr´e que ce type de classification induit d’importantes variations inter-observateurs, et qu’on ne peut le consid´erer comme une v´erit´e terrain.

Une d´ecision multiobservateurs peut alors ˆetre utilis´ee pour g´en´erer une esti-mation de la v´erit´e terrain, dans laquelle les diff´erentes d´ecisions des experts sont fusionn´ees pour former un compromis.

Parmi les m´ethodes d’estimation, la technique de ”vote” [Warfield et al., 1995] peut ˆetre utilis´ee pour s´electionner les voxels sur lesquels s’accorde la majorit´e des observateurs. N´eanmoins, avec cette m´ethode, les r´esultats sont fortement d´ependants de la mani`ere dont on d´efinit la ”majorit´e”.

D’autres strat´egies de vote plus avanc´ees existent, et peuvent op´erer aussi bien sur des ´etiquetages que sur des probabilit´es d’appartenance [Cordella et al., 1999], dans le contexte de la fusion de classifieurs [Kittler et al., 1998] mais aussi pour la combinaison de d´ecisions de diagnostic [Alonzo and Pepe, 1999].

´

Evidemment, la strat´egie de combinaison de d´ecisions doit ˆetre choisie selon les contraintes et les objectifs de l’´etude.

Dans nos applications, l’´etiquetage que nous recherchons doit pr´esenter le maxi-mum de similitudes avec tous les experts de mani`ere la plus ´egale possible. En d’autres termes, la v´erit´e estim´ee est celle qui maximise un crit`ere de similarit´e et/ou

recouvrement avec les ´etiquetages effectu´es par les trois observateurs, de mani`ere si-multan´ee.

STAPLE [Warfield et al.,2004] est une m´ethode bas´ee sur l’algorithme d’optimi-sation EM (Estimation Maximid’optimi-sation), qui permet d’estimer, de mani`ere simultan´ee, une v´erit´e qui maximise les performances de chacun des ´etiquetages consid´er´es.

Nous avons d’abord test´e cet algorithme sur des images de synth`ese dans les-quelles on dispose d’une v´erit´e terrain. Les images bruit´ees ont ´et´e segment´ees par cinq experts, et les ´etiquetages r´ecup´er´es utilis´es pour g´en´erer une v´erit´e estim´ee en utilisant STAPLE.

Nous avons ensuite confront´e cette estimation `a la v´erit´e terrain, et nous avons compar´e les mesures de similarit´e obtenues `a celles des ´etiquetages faits par les observateurs humains. Ces derniers avaient un DSC situ´e entre 92.91% et 96.11%, tandis que la v´erit´e estim´ee par STAPLE avait un DSC de 96.91%(figureB.2).

(a) (b)

(c) (d)

(e)

Figure B.2 – Estimation d’une v´erit´e `a l’aide de STAPLE, pour la r´eduction des biais relatifs aux observateurs. Cinq experts ont segment´e une image bruit´ee (b), g´en´er´ee `a partir d’une v´erit´e terrain (a). Une carte de la fr´equence d’´etiquetage est donn´ee dans (c). Le recouvrement entre la v´erit´e estim´ee par STAPLE (en rouge) et la v´erit´e terrain (en blanc) est illustr´e dans (d). Les barres d’histogrammes dans (e) montrent les performances des observateurs humains ainsi que de la v´erit´e estim´ee par STAPLE.

Annexe C

´

El´ements de la th´eorie des champs

de Markov

C.1 Notions de base

C.1.1 D´efinitions

On note X = {xs}s∈S le champs al´eatoire X d´efini sur l’ensemble S de sites (pixels dans le cas de l’imagerie) s,

C.1.1.1 Voisinage

On d´efinit le voisinage Vs d’un site (ou pixel) s comme l’ensemble des sites adjacents. Nous noterons t∼ s pour dire que t est voisin de s.

Dans le cas bidimensionnel, on peut consid´erer des voisinages de connexit´e 4 ou 8 comme le montre la figure C.1

4 voisins 8 voisins

Figure C.1 – Syst`emes de voisinage de connexit´es 4 et 8.

C.1.1.2 Cliques

On d´efinit les cliques, dans un syst`eme de voisinage donn´e, par l’ensemble des sites voisins : s1 et s2 appartiennent `a la mˆeme clique si et seulement si s1 ∼ s2.

La figure C.2 donne des exemples de cliques pour deux syst`emes de voisinage diff´erents.

4 voisins

8 voisins

Clique d’ordre 1 Clique d’ordre 2

Clique d’ordre1 Clique d’ordre 2

Clique d’ordre 3 Clique d’ordre 4

Figure C.2 – Diff´erentes cliques pour les syst`emes de voisinage de connexit´es 4 et 8.

C.1.1.3 Champs de Markov

Soit S l’ensemble des sites s, et Ω l’univers de r´ealisation des ´etiquettes xs. Un champ al´eatoire X ={xs}s∈S est dit de Markov si et seulement si



P (X)≥ 0 ∀X ∈ Ω|S|

P (Xs|Xr, r= s) = P (Xs|Xt, t ∼ s) (C.1) Autrement dit : la probabilit´e de la r´ealisation d’un site par rapport au reste des sites se r´eduit `a sa probabilit´e par rapport `a son voisinage.

C.1.1.4 Distribution de Gibbs

Un champ al´eatoire X ={Xs}s∈S est un champ de Gibbs si et seulement si P (X) = 1

Z exp [−U (X)] (C.2)

O`u U est une fonction d’´energie qui s’´ecrit U(x) = 

c∈C

Jc(Xc) (C.3)

Jc est le potentiel de la clique c, `a d´efinir. Xc est la restriction de X `a la clique c∈ C. C est l’ensemble des cliques de S selon un syst`eme de voisinage V .

C.1.2 Equivalence champs de Markov – distribution de Gibbs´

Le th´eor`eme de Hammersley–Clifford (1971), dont une d´emonstration est donn´ee dans [J.Besag, 1974], ´etablit l’´equivalence entre les champs de Markov et la distri-bution de Gibbs :

Th´eor`eme C.1.1. Soit S un ensemble de pixels muni d’un syst`eme de voisinage

V. Un champ X sur S est un champ de Markov relativement `a V , si et seulement

si X est un champ de Gibbs de potentiel associ´e `a V .