• Aucun résultat trouvé

Chapitre

10

Introduction

10.1 Contexte et motivation

Corrélation anatomo-radiologique : une tâche complexe

L’analyse des limites du système expert présenté dans la partie II (chapitre 8) et des schémas classiques de systèmes supervisés en général souligne l’influence majeure de la base d’apprentissage sur les performances. Celle-ci doit en effet être à la fois riche (i.e. contenir un grand nombre d’exemples) et fiable (i.e. reposer sur une vérité terrain indis-cutable, la référence histologique dans notre problématique).

Pour tous les patients constituant la base de données sur laquelle s’appuie l’étude précédemment présentée (lire chapitre 6), la présence de foyer(s) malin(s) a été révélée par biopsie. La localisation et l’extension de ce(s) foyer(s) a ensuite été vérifiée a pos-teriori par analyse de la pièce de prostatectomie, permettant d’établir une cartographie précise du cancer sur la glande. Finalement, les coupes histologiques et les images IRM-mp ont été analysées conjointement et les régions malignes repérées lors de l’analyse histolo-gique reportées, après consensus entre radiologues et anatomo-pathologistes, sur les images IRM-mp (lire section 6.5).

L’établissement d’une telle base de données, où les lésions malignes sont annotées sur les images IRM-mp de manière précise et exhaustive, est une tâche difficile et fastidieuse. Elle nécessite 1) d’avoir accès à la pièce histologique et 2) la mobilisation de radiologues et d’anatomo-pathologistes pour permettre une corrélation anatomo-radiologique.

Comme nous l’avons vu dans la section 4.7 dédiée à l’analyse de l’état de l’art, de nom-breuses études CAD doivent donc se limiter à l’utilisation de jeux de données annotées de taille parfois très restreinte. Par exemple, les travaux de Madabushi et coll. [67,68] s’ap-puient sur les données IRM histologiques de seulement 5 patients (dont seules 33 coupes au total sont étudiées) ; l’étude présentée par Viswanath et coll. [131] repose quant à elle sur les données de 6 patients (dont seulement 18 coupes sont étudiées).

Enfin, beaucoup d’études (voir en particulier les études [18,75,93,124] présentées section 4.7) ne peuvent pas s’appuyer sur une telle corrélation anatomo-radiologique et la vérité terrain utilisée est souvent le résultat :

– soit d’une analyse histologique partielle utilisant les résultats des biopsies randomi-sées (qui ne représente qu’un échantillonnage de la glande. . .), à partir de laquelle le radiologue positionne, seul, les foyers sur les images IRM,

– soit d’une analyse en aveugle (et donc subjective. . .) des images IRM-mp, réalisée par un radiologue expert.

Toutes deux sont entachées d’incertitude quant au véritable statut carcinologique des cibles (ROIs) contourées.

Néanmoins, ces études qui ne reposent que sur une "vérité expert" (par opposition à la "vé-rité histologique"), ont l’avantage de pouvoir présenter des bases de données plus riches en nombre de cas, avantage non négligeable en classification supervisée. Par exemple, l’étude de Puech et coll. [93] utilisent les données de 84 patients, dont 47 sont annotées par un radiologue expert.

La figure 10.1 illustre les différentes étapes de la constitution d’une base de données d’apprentissage clinique pour le cancer de la prostate.

10.1. CONTEXTE ET MOTIVATION

Figure 10.1 – Construction d’une base de données cliniques.

On rappelle qu’une mesure élevée du taux de PSA dans le sang peut être un marqueur de la présence de lésions cancéreuses dans la prostate. C’est donc un résultat élevé au test du PSA, qui engage le processus de recherche de présence de lésions cancéreuses dans la glande.

La référence actuelle pour le diagnostic du cancer de la prostate reste l’analyse histologique réalisée par le biais de biopsies "pseudo-aléatoires" qui seules attestent de la présence ou de l’absence de lésions cancéreuses sur la glande.

L’acquisition et l’analyse IRM-mp sont réalisées soit :

(1) avant les biopsies, pour les orienter dans les régions présentant un signal IRM suspect, (2) en complément des biopsies, pour qualifier l’extension de la tumeur détectée à la biop-sie et orienter le choix du traitement.

Le radiologue analyse ces images et repère les zones suspectes auxquelles il affecte un score de suspicion de malignité variant entre 0 et 4 (encart a)).

Une fois la présence du cancer avérée, la chirurgie peut être envisagée. Si tel est le cas, une analyse de la pièce de prostatectomie peut être réalisée afin de localiser précisément les foyers malins et établir la "vérité terrain" (encart b)). Cette cartographie du cancer de la prostate peut alors être reportée sur les images IRM-mp après consensus anatomo-radiologique. Les parties grisées représentent les étapes qui ne sont pas réalisées de manière systématique : certaines études CAD ne reposent pas sur une analyse des pièces de prosta-tectomie et une corrélation anatomo-radiologique pour constituer la base d’apprentissage.

Utilisation des scores experts

Lors de l’acquisition des images IRM-mp (voir illustration 10.1, a) le radiologue ana-lyse conjointement les signaux des différentes séquences, et repère les ROIs qui lui pa-raissent suspectes. La pratique standard, recommandée par les directives européennes [6,27], consiste alors à leur affecter un score subjectif à 5 points (échelle de Likert) re-flétant le degré de suspicion de malignité. Ce score est échelonné de la manière suivante : 0 = bénignité certaine, 1 = bénignité probable, 2 = score intermédiaire d’incertitude, 3 = malignité probable et 4 = malignité certaine.

Aucune des études CAD précédemment présentées section 4.7 n’exploite actuellement ce score. Afin de pouvoir s’appuyer sur des algorithmes de classification "classiques" (lire section 4.4) c’est en effet une version binaire (sain/pathologique) de l’analyse radiologique experte réalisée en aveugle qui est utilisée. Celle-ci peut être vue comme un seuillage du score de suspicion.

Or, ce score est porteur d’informations sur le degré de certitude du médecin et la difficulté d’analyse de la ROI, il s’apparente à une probabilité d’appartenance à l’une ou l’autre des deux classes de tissus et mérite donc d’être exploité en l’absence de référence histologique fiable.

Objectif général

La plupart des études se limitent en nombre de cas étudiés car la construction d’une vérité terrain dans laquelle tous les tissus sains/pathologiques sont discriminés de manière fiable, en se basant sur la référence histologique, est très difficile et contraignante.

Or, c’est la richesse d’une base de données d’apprentissage qui permet de créer un classifieur robuste avec une bonne capacité de généralisation.

Au lieu de rejeter les données IRM-mp pour lesquelles la vérité histologique n’est pas accessible ou incertaine, nous proposons au contraire de les inclure dans l’apprentissage en exploitant le score de suspicion affecté par le radiologue lors de son analyse "en aveugle".

10.2 Proposition

L’objectif de ce travail est de pouvoir se rapprocher de la problématique clinique dans laquelle on essaie de construire un système de classification de données en deux classes (sain/ pathologique), en se basant sur une base de données annotées par l’homme et donc possiblement entachée d’incertitude. Ce degré d’incertitude peut être directement estimé par l’expert en charge de l’annotation qui l’exprime par le biais d’une probabilité d’appartenance à une classe.

Dans la partie II précédente, nous avons présenté les résultats prometteurs d’un système CADx reposant sur un algorithme de type séparateur à vaste marge (SVM). Or, si les SVM

10.2. PROPOSITION

sont des algorithmes de discrimination efficaces, classiquement utilisés pour discriminer deux classes de données étiquetées de manière binaire (sain/pathologique), ils ne peuvent cependant pas être appliqués directement dans le cas où les données contiennent à la fois des étiquettes de classe certaines (sain/pathologique) et des étiquettes de classe incertaines (telles que des probabilités d’appartenance à une classe).

Dans la seconde partie de ce travail de thèse, nous proposons une nouvelle formulation des SVM permettant d’intégrer l’incertitude de l’expert sur la classe de certains exemples. Cette incertitude peut être exprimée par le score de suspicion de malignité (échelle de Likert). L’idée est d’apprendre une fonction discriminante qui, à la fois, maximise les per-formances de classification sur les étiquettes certaines et prédit au mieux les probabilités sur les étiquettes incertaines. Il s’agit donc de moduler classification et régression.

A ce propos, il nous a été suggéré que dans ces travaux, nous nous attaquons à un problème ouvert proposé dans le livre Learning with kernels par B. Scholkopf and A. Smola [109]. Il est en effet proche du problème 7.11 de la page 223 de ce livre. Nous proposons une manière de résoudre ce problème en prenant en compte une information probabiliste.

La suite de ce chapitre est organisée comme suit. Nous rappelons dans un premier temps la formulation classique des SVM, puis décrivons l’extension proposée. L’évalua-tion de ce nouvel algorithme, que l’on nommera P-SVM (pour Probabilistic SVM) afin de faciliter les discussions, est d’abord réalisée à l’aide d’exemples jouets puis sur une série de données cliniques. Nous montrons que le P-SVM permet de pondérer l’influence des cas d’interprétation difficile et d’obtenir de meilleures performances que celles réalisées en utilisant une vérité expert binaire.

Nous tenons à souligner que le travail que nous proposons dans cette partie est le fruit d’une collaboration forte avec Stéphane Canu et Rémi Flamary du laboratoire LITIS de Rouen (France). Nous les en remercions sincèrement.

Chapitre

11

Le séparateur à vaste marge (SVM) :