• Aucun résultat trouvé

L’information de la texture extraite à l’échelle des pixels offre de bonnes performances dans le domaine de l’analyse d’images histopathologiques malgré qu’elle ne soit pas aisément interprétable biologiquement. Ce manque d’interprétabilité est également révélateur de l’intérêt de ces méthodes puisqu’elles capturent de façon quantitative une information peu prise en compte par les pathologistes.

De nos jours, les images sont acquises avec des résolutions de plus en plus élevées. Ce surplus d’informations risque cependant de noyer des don- nées pertinentes en fonction des études et des objectifs considérés. Pour répondre à ce problème, les méthodes de la littérature se concentrent sur des approches multi-échelles afin de capturer le maximum d’informations. Ces techniques sont au final très lourdes en calcul et imposent souvent une étape de sélection de caractéristiques. Ce chapitre introduit une autre approche afin de remédier à ce problème en analysant les données à dispo- sition afin de localiser la ou les échelles les plus porteuses d’informations de texture pour une application donnée. Une variante à cette approche est également discutée et consiste à déformer les images pour faire ressortir de l’information pertinente. Les expérimentations réalisées sur trois appli- cations différentes montrent l’intérêt de sélectionner une échelle optimale plutôt que de capturer la texture à partir des images d’origine.

Actuellement, seule la résolution optimale a été prise en compte. Une première évolution de cette approche est donc de cumuler les informations issues de plusieurs échelles pertinentes. Cela impose néanmoins de tester la complémentarité des informations de texture issues des différentes échelles considérées via un test statistique. Une deuxième piste à poursuivre se- rait de valider le comportement de cette méthode sur de grandes bases de données médicales et d’étudier ses relations avec d’autres méthodes de classification plus adaptées à de larges ensembles d’images. Finalement, il serait intéressant de compléter l’information de texture extraite par les motifs binaires locaux par une mesure plus globale telle que la dimension fractale afin d’améliorer la robustesse de la méthode.

Chapitre 5

Prise de décision et interprétation

des mesures

L’analyse d’images histologiques se fait par l’extraction de nombreuses caractéristiques qui ne sont pas nécessairement interprétables biologique- ment. En revanche, la dernière étape de toute analyse est de parvenir à décrire les images à partir de ces caractéristiques. Pour cela, il est néces- saire d’avoir des outils permettant d’interpréter les mesures, de repérer leurs capacités de discrimination ainsi que leurs différences significatives. Ce dernier chapitre traite donc des statistiques mises en œuvre, tant des- criptives que déductives, que ce soit pour analyser les données à disposition (5.2) ou pour sélectionner les caractéristiques les plus discriminantes afin d’attribuer une étiquette aux échantillons (5.3). Finalement, les méthodes ici présentées sont illustrées et appliquées sur les données histologiques à disposition.

5.1

Motivation

L’analyse d’images histologiques s’achève par l’interprétation et l’étude de la pertinence des différentes caractéristiques extraites à partir des images vis-à-vis du contexte médical correspondant. Dans la littérature, plusieurs méthodes de tests statistiques sont ainsi appliquées avec des objectifs dif- férents. Notamment, Miedema et al. [2012] collectent de nombreuses ca- ractéristiques usuelles puis les analysent d’un point de vue statistique via le test d’hypothèse non paramétrique DiProPerm qui convient particuliè- rement aux données de hautes dimensions. Leur objectif est de déterminer les caractéristiques les plus discriminantes afin de comparer les lésions mé- lanocytaires.

Dans un autre contexte, Tuczek et al. [1996] étudient la pertinence de l’analyse d’images afin de retrouver le grade de carcinomes des seins par des études de corrélations entre la vérité terrain et les caractéristiques extraites. Par ces tests, ils montrent quelles caractéristiques sont associées avec les différents critères permettant d’établir le grade global.

Wild et al. [2000] emploient des analyses de la variance répétées pour étudier les différences dans le dénombrement manuel des micro-vaisseaux dans le cas des images de contrôle et de celles de traitement. Également, ils analysent les associations entre les mesures automatiques et manuelles visuellement par l’observation d’un scatterplot et mathématiquement par le calcul du coefficient de corrélation de Pearson.

Le coefficient de variation est utilisé par Taverna et al. [2009] pour évaluer les variations de la dimension fractale de la surface représentée par les vascularisations entre tissus cancéreux et sains. Cette étude a permis de conclure que cette information est un indice géométrique utile pour le diagnostic.

Une autre façon de sélectionner un sous-ensemble de caractéristiques et d’en valider les performances consiste à employer des outils ne permet- tant que peu d’interprétations biologiques mais attribuant des étiquettes de façon supervisée aux données. Quelques exemples de ces méthodes de classification et de sélection sont fournis dans le tableau5.1 conjointement aux caractéristiques utilisées.

Table 5.1 – Exemples de méthodes de classification et de sélection de caractéristiques à partir d’images histologiques. Kppv désigne les K plus proches voisins, GLCM les matrice de co-occurrences en niveaux de gris, PCA l’analyse en composante principale, LDA l’analyse discriminante li- néaire, SVM sont les supports vecteurs machine, ANOVA et MANOVA res- pectivement l’analyse de la variance et sa version multivariables, mRMR la sélection par minimum Redundancy Maximum Relevance, et RBF et PNN respectivement les réseaux Radial Basis Function et de neurones probabi- listes.

Organe Mesures Sélection Classification Références

Utérus Triangu- lation de Delaunay Test de Kruskal- Wallis et stepwise discri- minant analysis Kppv Keenan et al. [2000] Follicule GLCM couleur et organisa- tion des noyaux PCA et LDA Classifieur bayesien Sertel et al. [2009] Cell- graphs PCA SVM, classi- fieur bayesien et Kppv Oztan et al. [2012] Prostate GLCM et LBP ANOVA RBF Oliveira et al. [2014]

Rein Forme des

noyaux mRMR SVM Kothari et al. [2013b] Sein Texture et architec- ture des noyaux mRMR Multi-FOV et forêt d’arbres décisionnels Basavanhally et al. [2013] Texture MANOVA Kppv, PNN, SVM Loukas et al. [2013]

5.2

Statistiques pour l’interprétation des don-