• Aucun résultat trouvé

RIM-ONE (An Open Retinal Image Database for Optic Nerve Evaluation) :

Conception d’un système semi-supervisé d’aide au diagnostic pour la classification des images médicales

2. Système CADx proposé

2.1. Bases des images médicales

2.1.2. RIM-ONE (An Open Retinal Image Database for Optic Nerve Evaluation) :

Parmi les bases de données décrites dans la littérature, RIM-ONE est la base de données appropriée pour le diagnostic automatique du glaucome. RIM-ONE est une base de données d'images rétiniennes pour l'évaluation des nerfs optiques, collectée par la collaboration de trois organisations espagnoles. C'est une ressource essentielle pour l'élaboration d'algorithmes d'analyse d'images de la rétine. Elle aide les chercheurs à évaluer et à comparer les méthodes développées par rapport aux études rapportées dans l'état de l’art. Ainsi, RIM-ONE est utilisée pour développer de meilleurs algorithmes. Elle contient 169 images obtenues à partir de 169 images de fond d’œil classées en deux catégories : glaucome (74 images) et normal (95 images) [Fumero 2011]. La figure 4.3 montre quelques images tirées de la base de données RIM-ONE.

(a) (b)

(c) (d)

Figure 4.3. Un exemple des images tirées de la base de données RIM-ONE : (a) et (b) des cas normaux, (c) et (d) des cas glaucomes.

2.2. Prétraitement

Dans cette étape, deux types de prétraitement ont été appliqués sur l’image médicale à savoir ; la conversion en niveau de gris et la binarisation. D’une part, la matrice de co- occurrence est calculée à partir des images en niveau de gris. Pour cela, l’outil ImageJ a été utilisé pour l’opération de conversion en niveau de gris.

D’autre part, les moments de Hu et les moments Centraux sont déterminés à partir d'une version binarisée de l’image. La binarisation est le processus de conversion de l'image numérisée à l'échelle de gris en une image binaire avec un premier plan blanc et un arrière-plan noir. La binarisation est réalisée en utilisant la méthode d'Otsu [Otsu 1979], une brève description de cette méthode est présentée ci-dessous.

La méthode Otsu est utilisée pour effectuer un seuillage ou une réduction d'une image à niveaux de gris en une image binaire. Le seuil est une valeur d'intensité qui définit la limite entre les niveaux de gris dans une image qui sera transformée en deux classes d'une image binaire. Une approche, proposée par Otsu en 1979 [Otsu 1979], tente de déterminer le seuil

optimal pour une image utilisant des calculs statistiques. La séparation des classes est décrite en termes d'analyse statistique comme étant soit une variance élevée entre classes, soit une faible variance intra-classes, soit une combinaison des deux. Le seuil qui conduit à la meilleure séparation des classes est considéré comme optimal. Le travail récent de [Goh 2018] fournit une vue détaillée de la méthode Otsu.

Un exemple des images en niveau de gris et des images binaires de chaque base de données est représenté par la figure 4.4 et la figure 4.5.

L ’im age ori ginal e L’i m age en ni ve a u de g ri s L ’im age binai re

Figure 4.4. Exemple des images mammaires de la base de données DDSM : La première ligne consiste en deux images de la classe bénigne et deux images de classe maligne. La deuxième

ligne représente les images en niveau de gris après extraction de la tumeur. Les images binaires sont représentées en troisième ligne.

L’i m age or igi nal e L’i m age en n ive au de gri s L’i m age bi nai re

Figure 4.5. Un échantillon de la base de données RIM-ONE : La première ligne représente deux images de la classe normal et deux images de classe glaucome. La représentation en niveau de gris de ces images est donnée dans la deuxième ligne. Le résultat de la binarisation

est montré dans la troisième ligne. 2.3. Extraction des caractéristiques

Diverses caractéristiques ont été proposées dans la littérature pour la caractérisation d’une image ou d’une région dans l’image. Ces caractéristiques sont organisées en familles selon leur nature. La majorité des études choisissent une famille et analyse sa performance générée.

Dans ce travail, nous proposons d'étudier les performances d'un ensemble de familles de caractéristiques. Une coopération des méthodes hétérogènes de caractéristiques est utilisée afin d’extraire le maximum d’informations de l’image médicale.

Dans ce travail, nous avons opté pour une méthode basée sur la texture qui est la matrice de co-occurrence à niveau de gris (GLCM) et deux familles basées sur la forme qui sont : les moments de Hu et les moments centraux. Le chapitre 1 inclut plus de détails sur ces méthodes.

Les caractéristiques utilisées ainsi que le nombre total de caractéristiques composant le vecteur de descripteurs sont détaillées dans le tableau 4.1.

Tableau 4.1. Les caractéristiques utilisées pour représenter les images médicales

Méthodes d’extraction des caractéristiques

Caractéristiques utilisées Nombre de caractéristiques

GLCM

L’énergie (𝑃1), le contraste (𝑃2), la corrélation (𝑃3), La variance (𝑃4), Moment de la différence inverse (𝑃5), Moyenne des sommes (𝑃6), Variance des sommes (𝑃7), Entropie des sommes (𝑃8), Entropie (𝑃9), Variance des differénces (𝑃10), Entropie des différences (𝑃11), Informations sur la mesure de corrélation(𝑃12, 𝑃13).

13

Moments de Hu Les sept (7) moments invariants : 𝜙1, 𝜙2, 𝜙3, 𝜙4, 𝜙5, 𝜙6, 𝜙7 7 Moments Centraux 𝑝𝑞 =3: 𝜇00, 𝜇01, 𝜇10, 𝜇02, 𝜇20, 𝜇12, 𝜇21, 𝜇30, 𝜇31, 𝜇32, 𝜇13, 𝜇23 12 Total = 32 caractéristiques

2.4. Sélection des caractéristiques

L'objectif principal de la sélection de caractéristiques est de réduire la dimensionnalité en éliminant les caractéristiques non pertinentes tout en préservant les plus discriminantes.

L'usage d'un algorithme de sélection de caractéristiques est primordial dans le travail proposé. De nombreuses méthodes de sélection de caractéristiques ont été proposées. Ces méthodes pourraient être catégorisées en sélection séquentielle ou aléatoire. Les méthodes séquentielles sont simples et rapides, mais elles sont susceptibles de tomber dans des minima locaux. Le problème des minimums locaux est résolu dans les méthodes de sélection de caractéristiques aléatoires, mais avec des méthodes aléatoires, il est difficile de choisir les paramètres appropriés.

Pour éviter les problèmes de minima locaux et choisir les paramètres appropriés, nous avons utilisé les Algorithmes Génétiques (Genetic Algorithm (GA)) basée sur un modèle

wrapper, qui vise à trouver les caractéristiques optimales à partir du vecteur des caractéristiques potentielles.

Selon la nature du modèle wrapper utilisé ainsi que la fonction objective appliquée, nous avons conçu deux schémas différents de sélection des caractéristiques basés sur les algorithmes génétiques. Le premier est basé sur le modèle wrapper et le classifieur SVM supervisé (GA- SVM) pour valider le sous-ensemble optimal des caractéristiques [Zemmal 2016].

Tandis que le deuxième utilise un modèle wrapper et un classifieur semi-supervisé (GA- TSVM) tout en introduisant une nouvelle fonction objective prenant en considération la nature locale des classes. Les deux schémas sont englobés dans la figure 4.6.

Figure 4.6. Deux schémas proposés de sélection de caractéristique : à gauche le schéma GA- SVM (un algorithme génétique avec une fonction objective wrapper supervisé) et à droite le

schéma GA-TSVM (un algorithme génétique avec une fonction objective wrapper semi- supervisé) [Zemmal 2016 ; Zemmal 2017a].

Dans les deux schémas proposés, les chromosomes représentant des caractéristiques sont codés sous forme de bits pour former la population. Les opérateurs génétiques utilisés, à savoir la sélection, le croisement et la mutation, sont les mêmes pour les deux schémas et sont expliqués comme suit :

- L’encodage : l'algorithme génétique nécessite une représentation des solutions potentielles du problème. Dans notre approche, une chaîne de bits {0,1} est utilisée pour le codage binaire du chromosome représentant le vecteur des caractéristiques, où '0'

Mutation

Population

Evaluation de la fonction objective

Classifieur SVM Supervisé Croisement Critère d’arrêt N Y Sélection Sous-ensemble optimal de caractéristique (S1) Mutation Population

Evaluation de la fonction objective

Classifieur TSVM Semi-supervisé Croisement Critère d’arrêt N Y Sélection Sous-ensemble optimal de caractéristique (S2)

indique que la caractéristique n'est pas sélectionnée, tandis que '1' indique que la caractéristique est sélectionnée.

- La sélection : la sélection tend à accroître l'importance des bonnes solutions. Nous

avons opté pour l’opération de sélection la plus utilisée qui est la sélection par classement.

- Le croisement : Le croisement est destiné à enrichir la diversité de la population en manipulant la structure des chromosomes. D'une manière conventionnelle, les croisements sont envisagés avec deux parents et génèrent deux progénitures. Dans notre travail un croisement à un point est utilisé.

- La mutation : la mutation préserve la perte d'informations et permet d'explorer la zone d'espace de recherche qui n'est pas accessible par une opération de croisement. Dans le présent travail, l'opérateur de mutation proposé est la mutation uniforme.