• Aucun résultat trouvé

IV Mise en œuvre et validation de la méthode

11. Comparaison des méthodes de segmentation

Cette étude compare les résultats des forêts aléatoires avec ceux de BioVision et du multi-seuillage. Le but est de comparer les trois algorithmes présentés pour la segmentation de tissu marqué.

11.1. Résultats obtenus avec un marqueur spécifique : NeuN

Le vecteur initial de 114 caractéristiques détaillé Section 7.4 a été utilisé pour entraîner une forêt aléatoire et l’algorithme BioVision. Le multi-seuillage (Section 8) a été utilisé sur les images des deux bases NeuN converties en niveaux de gris. Les résultats produits avec BioVision avec le vecteur de 114 caractéristiques n’étaient pas concluant, BioVision n’étant pas adapté aux caractéristiques texturales. Le vecteur de caractéristiques RVBM qui contenait trois caractéristiques colorimétriques et l’image moyenne proposé par Chubb et associés fonctionne mieux que le vecteur initial que nous avons pu tester (Tableau 5).

F-Score BioVision avec RVBM [Chubb et al., 2006]

Seuillage au niveau 200

Forêt aléatoire avec le vecteur initial de caractéristiques

Validation

directe 0,82 0,86 0,88

Validation

croisée 0,84 0,85 0,89

Tableau 5 : F-Scores de la classe “tissu marqué” (neurones) pour BioVision, les forêts aléatoires et le seuillage optimal pour le marqueur NeuN. Le vecteur de 114 caractéristiques a été utilisé pour les forêts aléatoires et le vecteur RVBM pour BioVision. Les segmentations en validation directe et croisée sont semblables pour le marquage NeuN.

L’algorithme des forêts aléatoires a été testé avec des valeurs par défaut de ses hyperparamètres : une profondeur d’arbres de 4, 100 arbres de décisions et le même poids pour toutes les classes. Nous avons comparé les résultats de segmentation de cette forêt aléatoire avec les résultats du multi-seuillage sur les images de la base en niveaux de gris comme expliqué Section 8.3.2 (Figure 28). Les multi-seuillages sur la base d’apprentissage (Seuil VC) et sur la base de test (Seuil VD) ont donné des résultats inférieurs en termes de F-Score par rapport aux segmentations réalisées avec la forêt aléatoire en validation directe (FA VD) et en validation croisée (FA VC). Le meilleur résultat de seuil pour le multi-seuillage de la base d’apprentissage et de test était le seuil au niveau de gris 200, les scores étant de 0,86 et 0,85 respectivement. Les F-Scores de la forêt aléatoire étaient de 0,88 en validation directe et 0,89 en validation croisée. La forêt aléatoire représentait une augmentation de F-Score de 6,2% en moyenne par rapport à BioVision et une augmentation de 3,3% en moyenne par rapport au multi-seuillage. Les différents F-Score sont présentés dans le Tableau 5. Comme nous pouvons le voir Figure 29, la segmentation par BioVision avec le vecteur initial RVBM n’a pas permis de segmenter les neurones les plus clairs.

73 Figure 28 : Comparaison entre le multi-seuillage (Seuil) de la base d’apprentissage et la base de test, de BioVision en validation directe (VD) et en validation croisée (VC) et la forêt aléatoire (FA) en validation directe (VD) et la validation croisée (VC) pour le marqueur NeuN.

Comme nous pouvons le voir Figure 29, la segmentation avec BioVision est moins performant que la forêt aléatoire pour détecter les neurones plus clairs présents sur la deuxième image.

Figure 29 : Exemple d’images marquées avec l’anticorps NeuN extraites dans deux sous-régions différentes (l’hippocampe et le corps grenouillé latéral) avec les segmentations manuelles et automatiques.

74

11.2. Résultats obtenus avec un marqueur non-spécifique : anti-Phox2B

Le vecteur initial de caractéristiques détaillé Section 7.4 a été utilisé pour entraîner une forêt aléatoire et l’algorithme BioVision. Le multi-seuillage a été utilisé sur les images des deux bases converties en niveaux de gris (Section 8). Les bases utilisées ont été marquées à l’anti-Phox2B (Section 7.3).

Les résultats obtenus avec le marqueur anti-Phox2B sont similaires à ceux obtenus avec le marqueur NeuN. BioVision n’a pas fonctionné avec le vecteur de 114 caractéristiques et la forêt aléatoire a obtenu des meilleurs F-Score finaux que BioVision avec le vecteur RVBM et le multi-seuillage (voir Tableau 6). Entre les F-Scores résultant de la validation directe (VD et la validation croisée (VC), un écart de 10% est observé.

F-Score BioVision avec RVBM

Seuillage au niveau 150

Forêt aléatoire de base avec le vecteur initial de

caractéristiques

Forêt aléatoire optimisée avec le vecteur initial de

caractéristiques Validation

directe 0,12 0,15 0,49 0,65

Validation

croisée 0,21 0,14 0,42 0,58

Tableau 6 : F-Scores de la classe “neurone” pour BioVision, le seuillage optimal et les forêts aléatoires sans et avec optimisation pour le marqueur anti-Phox2B. Le vecteur de 114 caractéristiques a été utilisé pour les forêts aléatoires et le vecteur RVBM pour BioVision.

Néanmoins, les F-Scores étant inférieurs à 0,5 pour les hyperparamètres de base. Il a donc été décidé d’optimiser les hyperparamètres de la forêt aléatoire afin d’augmenter les valeurs de F-Score dans les deux conditions de validation. Tout d’abord, la profondeur d’arbre a été augmentée jusqu’à atteindre un plateau à partir d’une profondeur de 10 (Figure 30). Puis le poids de la classe “neurone” a été augmenté car cette classe est très minoritaire dans les images. Un optimum a été trouvé lorsque son poids était égal à 2. Il a donc été choisi de fixer la profondeur d’arbre à 10, le nombre d’arbres à 100 (le nombre d’arbre changeant peu les F-Score résultant) et le poids de la classe “neurone” à 2. Le nouveau F-F-Score calculé en validation directe était de 0,65 et celui en validation croisée de 0,58. Cela représentait une augmentation de 26% du F-Score grâce à l’optimisation.

Figure 30 : Optimisation des paramètres de la forêt aléatoire pour la segmentation du marqueur anti-Phox2B.

75 Une fois optimisée, la forêt aléatoire présente une augmentation de F-Score d’un facteur 4 en moyenne par rapport à BioVision et au multi-seuillage, dont le seuil optimal était 150 (Figure 31). Contrairement aux images marquées avec l’anticorps NeuN, les images anti-Phox2B sont très difficiles à segmenter (Figure 32). On peut voir des effets de bruit de segmentation sur certaines images et une partie des neurones n’est pas détecté, ce que l’on peut voir dans la deuxième image présentée Figure 32. En effet, le marqueur n’étant pas spécifique et se fixant dans quasiment tout le tissu (Section 7.4), les algorithmes de segmentation ont beaucoup de difficultés à détecter correctement les éléments de la classe “neurone”. La forêt aléatoire optimisée ici sera utilisée pour l’ensemble des étapes de sélection pour le marqueur anti-Phox2B.

Figure 31 : Comparaison des résultats obtenus entre le multi-seuillage de la base d’apprentissage et la base de test, BioVision dans les deux conditions de validation et la forêt aléatoire en validation directe et en validation croisée pour le marqueur anti-Phox2B.

76 Figure 32 : Exemple d’images marquées à l’anti-Phox2B avec les segmentations manuelles et automatiques.

La forêt aléatoire semble est la méthode indiquée pour segmenter au mieux les neurones marqués à l’anti-Phox2B. Pour la suite de ce manuscrit, la forêt aléatoire sera utilisée pour segmenter les deux marquages présentés.

12. Sélection de caractéristiques pour le marqueur spécifique