• Aucun résultat trouvé

Système d'aide à la décision médicale

3. Les systèmes d’aide au diagnostic/ détection

3.2. Composition d’un système d’aide au diagnostic (CADx)

3.2.4. Sélection des caractéristiques

Bien qu'il puisse sembler logique qu'un plus grand nombre de caractéristiques soit plus informatif qu'un nombre limité de caractéristiques, ce n'est pas le cas dans les applications réelles, compte tenu des trois principales raisons [Jain 2000]: Premièrement, la complexité et le coût de calcul augmente radicalement. Deuxièmement, bien que le nombre de données mal classées puisse diminuer, lorsque plus de caractéristiques sont ajoutées pour l’apprentissage du classifieur, il a été démontré que l'erreur de généralisation finira par augmenter [McLachlan 1992]. Troisièmement, dans le cas d'un nombre limité de données disponibles et d'un grand nombre de caractéristiques disponibles, il est plus probable que des caractéristiques peu ou pas discriminantes induisent du bruit, dégradant la généralisation du classifieur aux données inconnues [McLachlan 1992]. Par conséquent, la sélection des caractéristiques est une étape importante pour faire ressortir les caractéristiques les plus informatives et optimiser la capacité du classifieur à classer de manière fiable des données inconnues.

Selon que le critère de sélection des caractéristiques est basé sur le classifieur utilisé pour construire la règle de prédiction ou pas, on peut définir principalement deux types de sélection de caractéristiques. S'il est indépendant du critère, le processus de sélection des caractéristiques suit une approche de filtrage « filter » [Saeys 2007]. Sinon le processus de sélection des caractéristiques suit une approche enveloppante « wrapper » [Kohavi 1997]. Nous trouvons aussi un troisième type nommé approche intégrée « embedded », presque similaire à l’approche wrapper dans l’interaction avec le classifieur [Guyon 2003]. Le chapitre suivant fournit une vue plus détaillée du processus de sélection de caractéristiques ainsi que ses différentes étapes.

Plusieurs techniques de sélection des caractéristiques ont été proposées dans la littérature pour réduire la taille du vecteur de descripteurs de la zone d’intérêt. La section 4 dans le chapitre deux fourni également une revue sur quelques méthodes de sélection de caractéristiques.

La plupart des méthodes de sélection de caractéristiques existantes souffrent des problèmes des optimums locaux et / ou d'un coût de calcul élevé [Unler 2010 ; Liu 2011]. Par conséquent, une technique de recherche globale efficace est nécessaire pour mieux résoudre les problèmes

de sélection de caractéristiques. Les techniques telles que les métaheuristiques ont récemment reçu beaucoup d'attention de la part de la communauté de sélection de caractéristiques car elles sont bien connues pour leur capacité / potentiel de recherche globale [Siti 2015 ; Tamimi 2017]. Les Algorithmes Génétiques (AG) (Genetic Algorithm (GA)) constituent une famille des métaheuristiques qui sont largement utilisés dans le domaine médical. Les AGs diffèrent des méthodes de sélection des caractéristiques en raison de la vaste exploration de l'espace de recherche pour de nouvelles solutions.

De nombreux chercheurs ont tenté d'appliquer les AGs pour le diagnostic des maladies. Ils ont prouvé que cet algorithme fonctionne mieux dans le diagnostic des maladies du cœur [Nidhi 2012 ; Mokeddem 2013], des maladies pulmonaires [Diaz 2014 ; Lu 2014], des maladies de l’œil [Rao 2016 ; Belghith 2014], du diabète [Ephzibah 2011 ; Lakshimi 2014], et du cancer du sein [Yang 2013 ; Aalaei 2016].

Une autre méthode qui a prouvé son efficacité dans la réduction de l’espace de caractéristiques ainsi que sa capacité dans la recherche globale, les méthodes d’optimisation par essaims particulaires (Particle Swarm Optimization (PSO)). Le PSO a contribué dans la réalisation de plusieurs systèmes d’aide au diagnostic puissants [Pashaei 2015 ; Sheikhpour 2016 ; Alkeshuosh 2017]. Pour un état de l’art détaillé des méthodes de sélection des caractéristiques AG et PSO, nous recommandons l’étude de [Xue 2016].

3.2.5. Classification

La classification pour un système CADx est le processus de transformation de l'entrée quantitative (c'est-à-dire des caractéristiques) en un résultat qualitatif (c'est-à-dire un diagnostic, un pronostic, etc.). Cette étape est considérée comme la partie la plus importante d'un système d’aide au diagnostic. La sortie du classifieur peut être soit une valeur distincte, indiquant l'une des classes prédéfinies, soit un vecteur de valeur réelle, reflétant la probabilité qu'un motif provienne d'une classe spécifique [Jain 2000]. Afin de maximiser les performances du classifieur, il est important de régler de manière optimale toutes les étapes précédentes (segmentation, extraction et sélection des caractéristiques). La mise en place d'un classifieur nécessite trois étapes : la phase d'apprentissage, la phase d'évaluation des performances et la phase de test.

Au cours de l'étape d'apprentissage, le classifieur est entrainé pour apprendre les différences entre les classes connues sur la base des vecteurs de caractéristiques d'entrée ayant des étiquettes connues.

Basé sur les vecteurs de caractéristiques d'entrée, le classifieur crée une description « unique » de chaque catégorie de classification prédéfinie. Les vecteurs de caractéristiques d'entrée de chaque classe sont appelés « ensembles d’apprentissage ». Lorsque l'apprentissage est achevé, le classifieur est prêt à conclure des étiquettes de classification sur de nouvelles données qui n'ont pas été utilisées dans l’apprentissage. Les différentes techniques d’apprentissage seront détaillées dans le chapitre trois.

Plusieurs méthodes de classification ont été proposées dans la littérature. Généralement, dans la mise en œuvre du classifieur dans le traitement d'images médicales, des techniques de classification supervisée sont utilisées. Parmi les techniques supervisées les plus réputées citons :

- Naïf Bayésien (NB) Ce sont des classifieurs basés sur une technique probabiliste et le théorème de Bayes. Ils peuvent prédire des probabilités d'appartenance à une classe telles que la probabilité qu’une image donnée appartienne à une classe particulière. Les classifieurs bayésiens ont été largement appliqués dans les systèmes CADx [Waheed 2007 ; Po-Whei 2009 ; Karabatak 2015].

- Les Machines à Vecteur de Supports (SVMs) : Un classifieur SVM, trouve un hyperplan avec une marge maximale et des supports de vecteurs pour les données pendant la phase d'apprentissage. Un hyperplan généré avec les vecteurs de support et la marge maximale peut être considéré comme une frontière de décision qui sépare les échantillons d'une classe à une autre. Dans le diagnostic médical, les SVMs constituent une méthode très puissante et qui a été l’objet de réalisation de plusieurs CADx [Ghumbre 2011 ; Janardhanan 2015 ; Ben-Rabeh 2016 ; Dey 2016].

- k-Plus Proche Voisin (kPPV) : C'est l'une des plus anciennes méthodes de classification. Le classifieur kPPV classe un échantillon inconnu en calculant initialement la distance (en utilisant une mesure de distance, par exemple la distance euclidienne) Il identifie ensuite les k plus petites distances et la classe la plus représentée dans ces k classes est considérée comme l'étiquette de classe de sortie de l'échantillon inconnu. Le classifieur kPPV a été appliqué pour concevoir des CADx qui discrimine entre les cancers bénins et malins [Shouman 2012 ; Medjahed 2013 ; Thamilselvan 2016].

- Les Réseaux de Neurones Artificiels (RNA) : Les réseaux de neurones artificiels sont organisés en couches de nœuds interconnectés avec des poids sur chaque connexion. L'entrée est envoyée à une couche d'entrée et la sortie est obtenue à partir de la couche de sortie. Pour toutes les autres couches intermédiaires, la sortie de la couche i alimente en entrée la couche

i+1. Un nœud simule la fonction d'un neurone biologique et puisque plusieurs de ces nœuds sont interconnectés pour former une structure de type réseau, d’où vient le nom de réseau de neurones artificiels. Les RNAs ont été utilisés dans plusieurs CADx [Amato 2013 ; Vlad 2015 ; Kaymak 2017].

La classification non supervisée, a été moins utilisée pour la conception des CADx. Parmi les méthodes non supervisées les plus populaires nous trouvons :

- L’algorithme de K-moyenne (K-means) : L’algorithme fonctionne en précisant le nombre K de classes (clusters) attendues (K étant fixé par l’utilisateur). Il calcule la distance intra-classe et refixe les centres des classes selon les valeurs de distances. Un problème majeur dans ce type d’algorithme est le choix du paramètre K. l’algorithme de K-moyenne a été utilisé dans le diagnostic de différentes maladies [Radha 2014 ; Ayub 2016].

- La carte auto-organisatrice (Self-Organizing Map (SOM)): La carte auto-organisatrice est composée d’un ensemble de neurones connectés entre eux. Durant la phase d’apprentissage, chaque neurone se spécialise dans la reconnaissance d’un certain type d’entrées. Par rapport à l’algorithme de K-moyenne, cette méthode est la plus robuste. Mais elle présente un inconvénient majeur qui est le temps de calcul relatif à la construction de cette carte. Nous trouvons pas mal d’applications se basant sur cette méthode dans le domaine de diagnostic médical [Mei 2015 ; Tokunaga 2016].

Dans des travaux récents, plusieurs chercheurs se sont penchés vers l’utilisation de la classification semi-supervisée pour la conception des systèmes d’aide au diagnostic [Wu 2009; Ibrahim 2013 ; Masood 2015 ; Ang 2015 ; Tan 2015 ; Lu 2017]. La phase d’apprentissage dans la classification semi-supervisée est constituée en utilisant à la fois des données étiquetées et non étiquetées. Le chapitre trois présente les détails de ce type d’apprentissage ainsi que ses différentes techniques.

Après avoir présenté le schéma général d’un système d’aide au diagnostic (CADx) ainsi que les différentes étapes qui le composent, le tableau 1.1 illustre quelques systèmes CADx dédiés pour différentes maladies. Nous présentons dans ce tableau les méthodes d’extraction et de sélection de caractéristiques ainsi que les méthodes de classification adoptées. Les résultats en termes de précision (Pr), sensibilité (Sen), spécificité (Spe) et l’air sous la courbe ROC (AUC) sont présentés dans la dernière colonne.

Tableau 1.1. Les systèmes d’aide au diagnostic (CADx) récents des différentes maladies.

Références Maladies Extraction de

caractéristiques

Sélection de

caractéristiques Classification Résultats

[Wu 2009] Diagnostic de Diabète Caractéristiques Locales / LapSVM (Semi- Supervisée) Pr : 0.8229 Sen : 0.8640 Spe : 0.8640 [Dheeba 2012] Cancer du

sein LTEM AG RNA (Supervisée)

Pr : 0.94 Sen : 0.94 Spe : 0.92 [Radhakrishnan 2012] Cancer de prostate GLCM, GLRLM / SVM (Supervisée) Pr :0.9283 Sen : 0.9174 Spe :1.0 [Preethi 2013] Cancer du poumon LBP, GLCM, SIFT / LapSVM (Semi- Supervisée) Pr : 0.95 [Huang 2013] Cancer du sein GLCM, moments Hu et centraux Corrélation Régression Logistique (Supervisée) Pr :0.8842 Sen : 0.8926 Spe :0.8864 AUC :0.8926 [Kim 2013] Cancer du sein Caractéristiques locales / Co-apprentissage Pr : 0.76 AUC : 0.81 SVM (Supervisée) Pr : 0,81 AUC : 0.80 RNA (Supervisée) Pr : 0.61 AUC : 0.70 [Sundararaj 2014] Tumeur cérébrale GLCM PCA Arbre de décision (Supervisée) Pr :0.93 Sen : 0.96 Spe :0.76 [Bhuvaneswari 2014] Cancer de poumon Moments de Hu, moments Centraux AG Arbre de Décision (Supervisée) Sen : 1.0 Spe : 1.0 AUC : 1.0 NB (Supervisée) Sen : 0.75 Spe : 0.75 AUC : 0.8 [Ang 2015] Cancer du poumon Caractéristiques locales SBE S3VM (semi- supervisée) Pr :0.8395 [Huston 2016] Diagnostic de Glaucome

Moments de Hu / LDA (Supervisée)

Pr : 0.992 Sen : 0.99 Spe : 1.0 [Rao 2016] Diagnostic de Glaucome DWT, LBP AG Boosting (Supervisée) Pr : 0.9118 Sen :0.8733 Spe :0.9278 Bagging (Supervisée) Pr :0.9059 Sen :0.8733 Spe : 0.9194 Foret Aléatoire (Supervisée) Pr :0.8961 Sen :0.8533 Spe :0.9135 [Haleem 2016] Maladie de Glaucome GLCM, Filtre de

Gabor, DWT Wrapper-LDA SVM (Supervisée)

Pr : 0.944 Sen :0.923 Spe :0.953 [Singh 2016] Cancer du Sein Moments Hu, centraux et Zernik / Ada-DEWNN (Supervisée) Pr : 0.893 Sen : 0.835 Spe : 0.934 [Abubacker 2016] Cancer du

sein GLCM, DWT Corrélation ANN (Supervisée)

Pr : 0.951 Sen : 0.922 Spe : 0.931 [Lu 2017] Cancer de prostate Caractéristiques Locales KWRST TSVM (Semi- Supervisée) Pr : 0.98 [Pham 2017] Cancer du poumon GLCM / Régression logistique, SVM (Supervisée) Pr :0.90 Sen : 0.75 Spe :0.90 AUC :0.89

Nous pouvons remarquer que la majorité des travaux optent pour des caractéristiques de texture et de forme dans la phase d'extraction de caractéristiques. Nous remarquons également que la méthode GLCM est très bien sollicitée et a donné de bons résultats. Concernant la sélection des caractéristiques pertinentes, la plupart des travaux utilisent l'approche wrapper pour sélectionner le sous-ensemble de caractéristiques ; ainsi, nous observons une grande utilisation des algorithmes génétiques. Enfin, pour la classification, la plupart des travaux utilisent une classification supervisée. Mais avec l’évolution des systèmes ainsi que l’augmentation des maladies dans le monde, l’obtention des données étiquetées devient très difficile. C’est pourquoi, les chercheurs se sont orientés vers l’utilisation des méthodes semi supervisées pour réduire le coût d’étiquetage.

4. Conclusion

Ces dernières années, des systèmes CAD ont été développés pour automatiser la détection et/ou le diagnostic de plusieurs maladies et la classification des lésions bénignes et malignes dans différentes modalités d’imageries telles que l'échographie, la mammographie, l'IRM…etc.

Une étude plus ou moins approfondie concernant les différentes étapes d’un système CADx a été menée dans ce chapitre. Une telle étude est nécessaire afin de mieux comprendre le déroulement d’un système CADx et de faire des choix appropriés pour le traitement des images médicales.

Les principales étapes de la mise en œuvre d'un système de CADx ainsi que les techniques associées pour chaque étape ont été catégorisées et présentées dans ce chapitre. L'extraction des caractéristiques appropriées pour le diagnostic des lésions normales et anormales dépend de la nature de la masse et des modalités d'imagerie, dans lesquelles diverses caractéristiques ont été introduites dans ce chapitre. La sélection des caractéristiques qui constitue à son tour une des étapes importantes du CADx a été présentée ; un sous-ensemble pertinent des caractéristiques fera l’entrée du classifieur. Finalement, des techniques d’apprentissage automatiques ont été présentées pour développer un modèle de classification dédié au diagnostic de différentes maladies. Avec l’augmentation des données médicales, des techniques de classification supervisée peuvent être très couteuses en raison de nécessité de grande quantité de données étiquetées lors de l’apprentissage. C’est pourquoi, l’apprentissage semi-supervisé est la technique la plus sollicitée ces dernières années afin de réduire les coûts d’étiquetage tout en bénéficiant de tous les exemples offerts dans les bases des images médicales (étiquetées et non étiquetées).

Chapitre 02