• Aucun résultat trouvé

B. Synthèse des travaux de recherche

B.2 Base de données pour l’évaluation en imagerie médicale

B.2.4 Limitations de la simulation et alternatives

B.2.4.1 Limites de la simulation et perspectives

La synthèse des différents projets réalisés au cours des années 2000 souligne une progression forte du réalisme des données TEP simulées comme l’illustrent la comparaison des figures Figure B.2-1, Figure B.2-2 et Figure B.2-5. Une perspective de ce travail proposait de continuer à complexifier le modèle de simulation afin de reproduire les caractéristiques de texture observées sur les images médicales et liées à du bruit physiologique. L’approche que nous avions envisagée reposait sur des méthodes de synthèse de texture. L’idée consistait à paramétrer des modèles de texture sur des images cliniques puis à les plaquer sur le modèle anatomique afin de modéliser une distribution de radioactivité et de densité tissulaire non uniforme pour chaque organe. Cette idée était développée dans un projet déposé en 2012 dans le cadre de l’appel d’offres ‘Modèle Numérique’ de l’ANR mais il n’a pas été retenu.

Comme souligné dans la section précédente, l’introduction en clinique de scanners couplant la TEP et la TDM m’a conduite, dans un premier temps, à m’intéresser à la simulation d’images tomodensitométriques TDM, l’objectif étant de compléter les bases d’images OncoPET_DB et oncoPET_respi par les images TDM associées. Le bilan des travaux réalisés au cours de l’ANR VIP a rapidement montré que la précision du modèle anatomique XCAT, bien que satisfaisante pour l’imagerie TEP dominée par le bruit de mesure, n’était en revanche pas suffisante pour la simulation d’images anatomiques réalistes, dominées, quant à elles, par le bruit physiologique. Les efforts de recherche dans le domaine de la simulation doivent donc, à mon sens, se concentrer sur la modélisation précise des structures anatomiques et de la varaibilité des paramètres physiques que l’on essaie de simuler (hétérogénéité d’atténuation tissulaire en TDM, de fixation radioactive physiologique en TEP, de paramètres de relaxation en IRM etc..). Des avancées dans ce domaine permettront à nouveau à la simulation multi-modalités de tenir une place prépondérante dans le domaine de l’évaluation. Cet axe de recherche s’éloignait trop de mon centre d’intérêt scientifique, aussi j’ai décidé de recentrer mes travaux plus récents sur des bases de données cliniques, après avoir évalué différentes alternatives présentées dans la section suivante.

B.2.4.2 Alternatives à la simulation

Compte-tenu de la difficulté d’accès à des bases de données cliniques de grande dimension, j’avais envisagé de partir d’une petite population de cas cliniques et d’augmenter artificiellement sa taille par des méthodes de réplication de données de type bootstrap. Cette technique, appliquée à l’imagerie TEP, consiste à générer un jeu de données brutes (sinogramme ou données mode-liste avant reconstruction) par tirage aléatoire avec remise au sein d’une petite population d’images originales statistiquement équivalentes. J’ai proposé différentes stratégies d’échantillonnage de ces données et étudié l’influence du nombre d’échantillons de la population originale sur les propriétés statistiques des données rééchantillonnées. Ces travaux, réalisés à l’aide de données simulées, ont donné lieu à une publication dans IEEE TMI [Lartizien et al., 2010]. Je renvoie à la lecture de cet article pour la description de ce travail. Ces résultats démontrent la possibilité de répliquer des données en conservant les propriétés statistiques d’ordre 1 et 2 du bruit dans les images reconstruites avec un algorithme analytique ou itératif.

Les retombées scientifiques de ce travail sont intéressantes dans plusieurs domaines. Concernant la problématique l’analyse psychophysique développée dans la section B.3.3, l’utilisation de données répliquées par bootstrap permettrait

1) dans le cas d’études ROC classiques chez l’homme, d’augmenter la taille des bases d’échantillon et ainsi réduire la variabilité de mesure des performances diagnostiques (nous renvoyons à la section B.7.2 pour le rappel des métriques de performance de l’analyse psychophysique)

2) dans le cas de l’utilisation de modèles d’observateurs numériques, d’améliorer la précision de l’information statistique mesurée sur les données et ainsi d’estimer de manière plus précise les performances diagnostiques.

Cette méthode par bootstrap s’avère par ailleurs très intéressante pour améliorer la précision de l’information quantitative que l’on peut extraire de l’image TEP, et en particulier pour estimer l’erreur sur la mesure d’un paramètre.

L’article que nous avons publié dans la revue IEEE TMI faisait l’objet d’un taux de 9 citations totalisant un h-index égal à 3 en septembre 2014. L’intérêt majeur de ce travail portait sur les retombées potentielles dans le domaine de la quantification TEP.

Cette étude soulignait cependant quelques limites, la première étant l’impossibilité de générer des échantillons répliqués à partir d’une seule acquisition. Cela supposait donc de pouvoir disposer d’un jeu de données contenant plusieurs réplicats statistiquement équivalents de l’examen TEP de chaque patient. De plus, ce type de méthode permet d’augmenter la précision sur la mesure du bruit statistique mais ne renseigne pas sur les propriétés statistiques du bruit physiologique qui ne sont mesurables qu’en augmentant la variété de cas (i. e. de données). Ces différents points m’ont conduite à ne pas poursuivre cette piste plus avant.

(ii) Bases de données hybrides

L’une des difficultés principales liée à l’utilisation d’images cliniques pour l’évaluation concerne la définition de la vérité terrain. Il est en effet très difficile d’obtenir une annotation précise des zones pathologiques de l’image. L’équipe de G. El Fakhri et al à Boston a proposé une alternative intéressante consistant à fusionner des données brutes acquises sur des volontaires sains avec des acquisitions de fantôme (sphère de plexiglass) reproduisant les zones pathologiques [El Fakhri et al., 2007]. Le positionnement précis des sphères dans le patient était réalisé grâce à un support en plexiglass peu atténuant et calibré en position. Ces bases de données hybrides ont été exploitées dans de nombreuses études publiées par cette équipe pour l’évaluation. Nous discutons de ces résultats dans la section B.3.4. Ce choix méthodologique se heurte néanmoins à certaines limitations. La première concerne l’enregistrement des coïncidences diffusées. L’environnement tissulaire des sphères influence en effet directement la distribution de ce type de coïncidences parasites. Il est donc probable que le profil des coïncidences diffusées produites par les sources radioactives sphériques dans l’air soit différent du profil mesuré lorsque ces mêmes sources sont placées à l’intérieur du patient. On peut donc s’interroger sur l’impact de ces différences sur la détection. De plus, les acquisitions de sources externes ne reproduisent pas le mouvement respiratoire et physiologique des patients, de sorte que les images reconstruites ne sont pas affectées par ce terme de dégradation.

L’impact de ces deux phénomènes sur les performances diagnostiques n’ayant pas été clairement évalué, j’ai préféré ne pas suivre cette approche et fait résolument le choix de travailler avec des données cliniques.

(iii) Création de bases de données cliniques annotées

Une piste intéressante pour constituer une base de données cliniques de taille acceptable consiste à mutualiser les efforts de plusieurs centres d’imagerie pour collecter, annoter et mettre à disposition des jeux de données auprès de la communauté scientifique.

Ce travail de collecte a été réalisé pour différentes modalités d’imagerie, en particulier en TDM pulmonaire et en mammographie avec la constitution de bases d’images cliniques annotées distribuées :

- la Digital Database For Screening Mammography (DDSM)

o http://marathon.csee.usf.edu/Mammography/Database.html, - la Mammographic Image Analysis Society (MIAS)

o http://peipa.essex.ac.uk/info/mias.html

- la Lung Image Database Consortium (LIDC) pour la TDM. o http://www.cancerimagingarchive.net/

Cette piste tend à se développer pour d’autres applications cliniques sous l’impulsion, d’une part des études cliniques multicentriques, et d’autre part, de la communauté du traitement et de l’analyse des images médicales qui organise depuis quelques années, au sein de conférences internationales du domaine, des compétitions (challenge) ciblées sur une problématique précise (e.g. segmentation du ventricule en imagerie IRM cardiaque) permettant d’évaluer conjointement plusieurs algorithmes sur la même base de données. Ces challenges nécessitent ainsi de collecter des bases d’images rigoureusement annotées et mises ensuite à la disposition de la communauté.

L’analyse régulière de la littérature et de ces différentes manifestations montre l’absence de bases d’images cliniques TEP ou TEP/TDM oncologiques répondant aux critères statistiques requis pour les méthodes par apprentissage. J’ai donc, à partir de 2009, comme auparavant pour les données simulées, consacré une part de mon activité à la collecte de bases d’images cliniques adaptées au besoin des systèmes d’aide au diagnostic.

Analyse psychophysique en imagerie nucléaire par émission de

positons

B.3 Analyse psychophysique en imagerie nucléaire par émission de