• Aucun résultat trouvé

En traitement d’images toutes catégories confondues, nous assistons depuis plusieurs décennies à un foisonnement de méthodes pour la seg-mentation des images, le problème de l’évaluation est devenu crucial du moment que les chercheurs ont besoin de comparer un nouvel algorithme par rapport à ceux préexistants, ainsi que pour les utilisateurs afin de choisir un algorithme et régler ses paramètres en fonction du problème à résoudre.

Les critères d’évaluation quantitative découlent de deux groupes, à condition de disposer ou non d’une "vérité-terrain" qui constitue une seg-mentation de référence. L’évaluation visuelle de résultats de segseg-mentation

Figure 2.15 – Variabilité des classe d’images en imagerie microscopique

reste toujours présente et particulièrement dans domaine médical, mais présente l’inconvénient lié à sa mise en œuvre qui s’avère particulière-ment longue et fastidieuse pour les experts. Il devient alors primordial de procéder à une évaluation complètement automatisée.

Nous allons présenter dès à présent, un état de l’art succinct des diffé-rentes méthodes d’évaluation existantes que nous classons dans les deux groupes précédemment cités, ensuite nous proposons une nouvelle mé-thode d’évaluation spécialement adaptée aux attentes des experts du do-maine de la cytologie médullaire.

– Sans vérité-terrain :

Dans la littérature, plusieurs critères d’évaluation de segmentation sans vérité terrain ont vu le jour, qu’on peut classer dans deux archétypes. Soit basé sur des critères de contraste qui recherchent une variabilité inter-région, ou sur des critères d’adéquation à un modèle qui recherche une uniformité en intensité ou en couleur à l’intérieur des régions.

Ces évaluations cherchent à quantifier la qualité ou la lisibilité de l’image, ils ont l’avantage de ne pas nécessiter de vérité terrain ou de seg-mentation de référence. Leur utilisation est justifiée dans des domaines d’application où la construction d’une base de vérité terrain est délicate ou trop coûteuse en temps. Parmi les critères les plus couramment trouvés dans la littérature traitant de l’évaluation des méthodes de segmentation sans vérité terrain, on trouve :

la minimisation de la somme des variances de régions (Levine and Nazif 1985) ;

2. Contraste inter-région de Levine et Nazif : basé sur le calcul la somme des contrastes des régions (Levine and Nazif 1985) ;

3. Contraste de Zeboudj : prend en compte le contraste intérieur et extérieur aux régions mesurées sur un voisinage de chaque pixel (Cocquerez and Philipp 1995) ;

4. Mesure de dissimilarité de Liu et Yang : intègre trois paramètres qui sont le nombre de régions, l’aire des régions et la couleur moyenne de chaque région (Liu and Yang 1994) ;

5. Critère de Borsotti et al. : est une amélioration de la mesure de Liu et Yang présentée ci-dessus qui avait pour inconvénient de pénaliser les segmentations ayant un nombre de régions trop importantes ou ayant des régions non homogènes en couleur (Borsotti et al. 1998) ; 6. Critère de Rosenberger : basé sur le calcul de la disparité intra-région

et la disparité inter-région (Chabrier et al. 2004). – Avec vérité-terrain :

Acquérir une segmentation de référence ou d’une vérité terrain est parfois difficile pour plusieurs causes. La première réside dans l’incapacité d’ob-tenir un nombre suffisant d’images pour constituer une base de référence du fait dans certains cas de la nature de ces images, la deuxième est liée au problème de concordance entre les experts(absence d’une harmonie), ou encore il est souvent pénible de délimiter les pourtours de régions (pré-sence de flou lors de l’acquisition, de bruit, de débordement de coloration) et pour finir le temps excessif que doit passer un expert pour segmenter finement une seule image.

Étant donné qu’on dispose d’une segmentation de référence, les mé-thodes d’évaluations seront basées sur une mesure de similarité entre l’image segmentée et sa vérité terrain. La définition de cette mesure de similarité fera la différence entre les évaluations suivantes :

1. Mesure de Vinet et al. : s’appuie sur un appariement biunivoque entre les régions des deux segmentations à comparer, en d’autres termes, détermine des couples de régions assurant un recouvrement maximum entre deux segmentations dont l’une correspond à la vé-rité terrain (Cohen et al. 1989) ;

2. Mesure de Martin : mesure la cohérence entre deux segmentations en se basant sur l’erreur calculée en chaque pixel mesurée, soit par l’erreur locale de cohérence, soit par l’erreur globale de cohérence (Martin 2002) ;

3. Mesure de Yasnoff et al. : consiste à compter le nombre de pixels mal segmentés tout en tenant compte de leur position (Yasnoff et al. 1978) ;

4. Distance de Baddeley : repose sur le calcul de cette distance, qui prend en compte, non seulement la position du site dans l’image, mais également son intensité (Wilson et al. 1997).

– Une méthode d’évaluation adaptée à la cytologie médullaire : Dans un système d’aide à la décision et particulièrement le domaine mé-dical, la méthode d’évaluation des résultats est capitale pour établir un diagnostic fiable. À cet effet, nous allons établir une méthode d’évaluation spécialement adaptée cytologie médullaire. L’utilisation d’images micro-scopiques et notamment de cytologie médullaire requiert un critère d’éva-luation adapté à la nature des images à traiter et donc plus performant que ceux précités. Puisque notre segmentation des images cytologiques mé-dullaires s’inspire de l’approche de segmentation par classification pixel-laire, il convient alors d’opter pour une évaluation de segmentation basée sur des évaluations des performances du classifieur. Nous rappelons que notre classification pixellaire a été réalisée avec un classifieur supervisé, et par conséquent nous présentons ci-dessous les critères d’évaluation les plus communément utilisés.

On se base sur un appariement des pixels des images segmentés et vérité terrain, et on calcule le nombre de pixels correctement identifiés et les pixels mal classés. On entend par un mal classé, soit un pixel de la classe C dans l’image de référence n’est pas reconnu comme étant de la même classe dans l’image segmentée, ou bien un pixel n’étant pas de la classe C dans l’image segmentée est reconnu comme étant de la classe C dans l’image de référence.

On définit dans un test de classification binaire, un résultat est dit : – Vrai Positif (TP : True Positif) lorsqu’un item est correctement détecté

par le test ;

– Faux Positif (FP : False Positif) est le résultat pour un item déclaré positif alors qu’il ne l’était pas ;

– Faux Négatif (FN : False Negatif) pour un item déclaré négatif alors qu’il était en réalité positif ;

– Vrai Négatif (TN : True Negatif) est l’item correctement déclaré comme négatif.

– Matrice de confusion deux classes :

Réel

Positive Negative

Prédit

Positive TP FP

Negative FN TN

– Précision, Rappel et Accuracy :

Dans une tâche de classification, la "Précision" d’une classe est le nombre de vrais positifs (c’est à dire le nombre d’éléments correctement étiquetés comme appartenant à la classe positive) divisé par le nombre to-tal d’éléments étiquetés comme appartenant à la classe positive (la somme de vrais positifs et des faux positifs, qui sont des éléments incorrectement étiquetés comme appartenant à la classe). Le "Rappel" dans ce contexte est défini comme le nombre de vrais positifs divisé par le nombre total d’éléments qui appartiennent réellement à la classe positive (c’est à dire la somme des vrais positifs et des faux négatifs. Ces derniers sont des items qui ne sont pas étiquetés comme appartenant à la classe positive mais aurait dû l’être).

Precision= TPTP+FP

Rappel= TPTP+FN

Accuracy= TP+FNTP++TNFP+TN

(2.1)

– Sensibilité et Spécifité :

En statistique, la sensibilité d’un test mesure sa capacité à donner un résul-tat positif lorsqu’une hypothèse est vérifiée. Elle s’oppose à la spécificité, qui mesure la capacité d’un test à donner un résultat négatif lorsque l’hy-pothèse n’est pas vérifiée. Ces notions sont d’une importance majeure en épidémiologie.

Sensibilite= TPTP+FN

Speci f icite= FPTN+TN

(2.2)

– Matrice de confusion Multi-classes : Réel C1 C2 ... Ci ... Cn C1 c11 c21 ci1 c1n C2 c12 c22 ci2 c2n Prédit ... ... Ci c1i c2i cii cni ... ... Cn c1n c2n cin cnnPrédiction correcte : ci i

• Prédiction incorrecte : cji avec i6=j – Précision, Rappel et Accuracy :

Rappel(ci) = cii ∑n j=1ci j Precision(ci) = cii ∑n j=1cji Accuracy= ∑n i=1ci i ∑n i,j=1cji (2.3)

La méthode proposée fournit un indice de qualité sur la reconnais-sance de toutes les classes de l’image, mais on donnera une attention particulière aux deux classes noyau et cytoplasme puisque celles-ci re-présentent la région d’intérêt.

3.4 Panorama des méthodes de classification