• Aucun résultat trouvé

2. Méthode de segmentation des neurones

2.3. Segmentation du marquage neuronal par apprentissage/classification

2.3.3. Création du modèle d’apprentissage optimal par RF

Pour créer le modèle d’apprentissage, il a fallu définir les caractéristiques optimales. Nous avons au total étudié 17 caractéristiques de colorimétrie (Cheng et al., 2001) et de texture : R, G, B, H, S, V, X, Y, Z, L*, a*, b*, M, V, LBP 11, LBP 40, LBP 63. Elles sont décrites dans le Tableau 3.

Tableau 3 : Caractéristiques à étudier pour créer le modèle d’apprentissage.

Caractéristiques Commentaires

Colorimétrie

RGB Red Green Blue, trois couleurs primaires – rouge, vert, bleu.

HSV

Hue Saturation Value, correspondant à la teinte, la saturation et la valeur, c’est un autre espace de couleur qui est plus intuitif pour la vision humaine.

XYZ

Un espace de couleur défini par CIE (Commission internationale de l’éclairage) qui a été développé pour représenter l'uniformité perceptuelle et répond ainsi au besoin psychophysique d'un observateur humain. Il a trois primaires notés X, Y et Z. Toute couleur peut être spécifiée par la combinaison de X, Y et Z.

L*a*b* Un autre espace de couleur défini par CIE qui peut être calculé par la

transformation non linéaire des composantes de l’espace XYZ.

Intensité locale MV

Il s’agit de la moyenne et de la variance des valeurs d'intensité converties en niveau de gris sur un élément structurant (une croix d’amplitude 10 pixels qui correspond au rayon minimal de neurone attendu – 2,5 μm)

Texture LBP Local Binary Patterns. 11, 40, 63 correspondent respectivement au

rayon de petit, de moyen et de grand neurone en nombre de pixels Pour les caractéristiques de textures, nous précisons en détail le calcul de LBP qui est une caractéristique puissante pour reconnaître des textures dans des images (Wang et He, 1990; Ojala et al., 1996; Ojala et al., 2002). Elle est calculée facilement et considérée comme robuste aux changements de niveau de gris dûs à la variation de luminance. La texture LBP est calculée dans un cercle de rayon prédéfini dans une image en niveaux de gris. Soit gc la valeur d’intensité du centroïde

c du cercle, gp la valeur d’intensité des pixels p (p=0, 1, ..., P-1) dans ce cercle. Nous comparons alors

chaque pixel p avec le centroïde c, si la valeur d’intensité de p est plus grande ou égale à celle de c, la valeur d’intensité de p est alors remplacée par 1, sinon, elle est remplacée par 0. Les P pixels génèrent un vecteur de caractéristiques, ex. (1,1,1,1,0,0,0,1) dans la Figure 40. La caractéristique de texture LBP est la valeur décimale convertie par ce vecteur et est calculée selon l’équation 5.

 

1 0

2

P p c p p c

g

g

LBP

(5)

Oùδ est la fonction de Heaviside.

50

Comme la taille des neurones varie entre 5 et 30 µm de diamètre (soit de 11 à 68 pixels de rayon), dans notre cas, nous avons testé des éléments structurants sous forme de cercles de rayon 11, 40 et 68 pixels.

La Figure 41 montre les résultats de notre étude obtenus avec les différentes combinaisons de caractéristiques lorsque l’on réduit progressivement le nombre de caractéristiques en sélectionnant les plus informatives. Les pourcentages correspondent à l’importance des caractéristiques dans les RF (Breiman et al., 1984), qui est définie comme la diminution totale de l'impureté du nœud en moyenne sur tous les arbres de l’ensemble. Si la diminution est faible, la caractéristique n'est pas importante et inversement.

Figure 41 : Etude de différentes combinaisons de caractéristiques. Bleu : caractéristiques de l’espace colorimétrique. Violet : caractéristiques de l’intensité locale. Rouge : caractéristiques de textures. D’après l’étude de Clément Bouvier (thèse du CEA-MIRCen en cours).

La Figure 42 montre la similarité (F-score) entre la segmentation manuelle et les segmentations automatiques des 42 imagettes issues de la base de validation selon les différentes combinaisons de caractéristiques (42 imagettes ici au lieu de 46 car il existe 4 imagettes sans tissu marqué issues de zones de matière blanche ou du fond sans tissu et leurs segmentations sont totalement correctes à savoir qu’il n’y a pas de classe neurone détectée). Le F-score correspond également à l’indice Dice (Sørensen, 1948) très largement utilisé en traitement de l’image pour évaluer la qualité de segmentation. De façon empirique, des valeurs de F-score supérieures à 0,7 sont généralement considérées comme satisfaisantes. Le Tableau 4 liste les valeurs moyennes de F-score de chaque combinaison de caractéristiques testée pour 3 groupes de neurones : imagettes de tous les neurones dans les 42 imagettes, imagettes contenant des neurones plus clairs (qui existent dans l’imagette du globus pallidus interne et l’imagette du corps genouillé latéral) et imagettes contenant des neurones généralement foncés (qui existent dans les imagettes restantes). La Figure 28 (image de gauche) illustre des exemples de neurones plus clairs qui sont caractérisés par une faible intensité de coloration. Si le F-score est très important donc proche de 1, la segmentation automatique est de très bonne qualité et inversement (score proche de zéro) – la superposition des segmentations comparées est faible.

51

Figure 42 : Comparaison (F-score) entre la segmentation manuelle et les segmentations automatiques obtenues en fonction de différentes combinaisons de caractéristiques testées. « ctx » est une abréviation pour le nom de la région du cortex. « LG » est une abréviation anglaise pour le nom de la région du corps genouillé latéral. D’après l’étude de Clément Bouvier (thèse du CEA-MIRCen en cours).

Tableau 4 : Valeurs moyennes de F-score pour tous les neurones dans les 42 imagettes, pour des jeux d’images contenant des neurones clairs (qui existent dans une imagette du globus pallidus interne et six imagettes du corps genouillé latéral) et pour des d’images contenant des neurones généralement foncés (qui existent dans les imagettes restantes).

F-score 17 features LAB MV

Lbp 11 40 68

LMV Lbp 11 40 68

LMV

Lbp 40 LMV

Tous les neurones 0,80 0,80 0,80 0,78 0,73

Neurones foncés 0,87 0,87 0,87 0,86 0,85

Neurones clairs 0,46 0,46 0,45 0,37 0,11

Nous observons que le F-score est identique pour les trois premières combinaisons des caractéristiques (17 features, LAB MV Lbp 11 40 68 et LMV Lbp 11 40 68). Il s’agit des caractéristiques colorimétriques, des caractéristiques d’intensité locale et des caractéristiques de texture. Cela démontre que nous pouvons diminuer le nombre de caractéristiques colorimétriques pour réduire le volume de données à traiter, économiser du temps de calcul et garder en même temps la qualité de la segmentation produite. Lorsque nous diminuons le nombre des caractéristiques de textures jusqu’à la quatrième combinaison (LMV Lbp 40), le F-score baisse légèrement de 2,5% pour tous les neurones, de 1,1% pour les neurones foncés et de 17,8% pour les neurones clairs par rapport à la combinaison LMV Lbp 11 40 68. Le F-score baisse de 8,8% pour tous les neurones, de 2,3% pour les neurones foncés et de 75,6% pour les neurones clairs dans le cinquième cas de combinaison (LMV) par rapport à la combinaison LMV Lbp 11 40 68. Ceci s’explique du fait qu’il n’y a plus de caractéristiques de texture ce qui démontre l’importance de ce type de caractéristique pour la segmentation du marquage NeuN. En prenant en considération un compromis entre performance et temps de calcul, nous avons choisis d’utiliser la combinaison LMV Lbp 40 pour réaliser les segmentations automatiques du marquage NeuN.

Coupe 81

Coupe 101

F- sco re globus pallidus interne Corps genouillé latéral

52

Nous avons extrait les quatre caractéristiques retenues sur les images de la base d’apprentissage et de la base de validation. La Figure 43 illustre les images correspondant à ces quatre caractéristiques sur un exemple.

Figure 43 : Extraction des caractéristiques retenues. a) Imagette dans laquelle les neurones sont marqués par NeuN. Les neurones apparaissent en marron foncé. b-e) Respectivement, les quatre caractéristiques utilisées pour la segmentation du marquage NeuN : b) L*, c) M, la moyenne et d) V, la variance de nuances de gris convertie à partir de l’image RGB, et e) LBP avec un élément structurant en forme de disque de rayon 40 pixels.

Lors de la phase d’apprentissage par la méthode RF, nous avons choisis de générer le modèle RF en construisant B=100 arbres de décision de profondeur 4 (Figure 44). Ces arbres sont construits en utilisant un tirage avec remise d’un nombre N d’observations dans notre base d’apprentissage. Le partitionnement de ces quatre caractéristiques pour chaque arbre de décision est calculé en fonction de la maximisation d’IG ou de la minimisation de la somme pondérée de l’entropie enfant.

Figure 44 : Illustration du modèle de RF utilisé.