• Aucun résultat trouvé

Application à l’exploration de données en neuroimagerie

7.1 Contexte de l’implémentation

7.2.2 Présentation des résultats

La réalisation des étapes 1 à 8 du cas d’utilisation introduit en début de chapitre (voir le paragraphe7.1.1) est présentée dans cette sous-section : de la création d’un étude au calcul d’un GMD pour analyser l’impact d’une caractéristique des sujets (par exemple l’âge, la latéralité ou le genre) sur la connectivité fonctionnelle au repos.

7.2.2.1 Données brutes

Les données brutes sont générées aux étapes 1 et 2 du cas d’utilisation : création d’une étude et import des données brutes. Un contrôle qualité est effectué sur les données brutes auxquelles sont associées à un statut {unverified, verified,rejected}. Les datasets peuvent être ouverts dans l’interface (fichiers textes, pdf...) ou en local sur la machine de l’utilisateur, grâce aux connexions à des logiciels externes. Les métadonnées de la classification sont affichés dans un onglet de l’interface PLM. La figure 7.5 montre dans l’interface de Teamcenter les données brutes associées à un sujet : examens, acquisitions et unités de données.

Pour l’étude GINT1, tous les examens d’imagerie IRM fonctionnelle à l’état de repos conscient ont été acquis suivant le même protocole qui est décrit dans la base de données PLM. La figure 7.6présente la structure des objets de définition correspondants dans la base PLM implémentée au GIN.

7.2.2.2 Calcul de la matrice de connectivité fonctionnelle d’un sujet ayant passé un examen IRMf au repos

Les données dérivées sont calculées dans les étapes 3 à 8 de cas d’utilisation. Les étapes 3 et 4 permettent de calculer les matrice de connectivité fonctionnelle pour chaque sujet du

Figure 7.5 – Examens passés par le sujet t0444 dans le cadre de l’étude GINT1 dans Team-center. a) Arbre des données appartenant au sujet t0444, b) Image IRM anatomique visualisée depuis Teamcenter, c) Valeurs des attributs de classification pour l’objet DUima_anat.

Figure 7.6 – Objets de définition d’un examen d’imagerie IRM depuis le module relation browser de Teamcenter.

jeu de données. Les chaînes de traitement ne peuvent être lancée que sur des données brutes et des données dérivées dont le statut est verified. L’utilisateur indique au workflow de calcul les données d’entrée et la définition de la chaîne de traitements à appliquer. L’ensemble des données est envoyé sur des grilles de calcul externes au système PLM, puis lorsque les calculs sont terminées, les données résultats sont remontées dans Teamcenter où la provenance est crée automatiquement. La dernière étape du workflow consiste à prévenir l’utilisateur que les résultats sont arrivés dans la base de données.

La figure 7.7 présente les résultats de la chaîne de traitement dans Teamcenter, et illustre les différentes façons de naviguer à travers la provenance des données.

Figure 7.7 – Navigation dans Teamcenter : a) visualisation de la chaîne de calcul qui utilise les données d’imagerie de repos ACQima_epi_repos, b) visualisation de la provenance du calcul de création de la matrice d’adjacence de connectivité fonctionnelle PUR4_AdjacencyMatrix_1, c) Arbre des données appartenant au sujet t0444 dans lequel est stocké l’acquisition d’imagerie de repos ACQima_epi_repos.

7.2.2.3 Création d’un GMD sur des données de groupe

Les étapes 5 à 8 permettent la création d’un GMD prêt pour l’exploration visuelle de la connectivité fonctionnelle cérébrale selon plusieurs dimensions (l’étape 9 – l’exploration OCL – du cas d’utilisation est développée dans la section 7.3de ce chapitre). Dans un premier temps, les groupes de sujets sont crées à partir de requêtes sur des paramètres d’intérêt. Les systèmes PLM permettent de construire des requêtes personnalisées sur des relations complexes ; deux exemples de requêtes sont présentés dans la figure7.8. Une fois les groupes créés, une chaîne de traitements est appliquée en parallèle sur tous les groupes de sujets pour calculer les matrices de connectivité de chaque groupe. Un GMD est créé à partir des matrices de connectivité de

chaque groupe, puis la préparation OCL des données est calculée pour obtenir un GMD prêt pour l’exploration visuelle.

La chaîne de traitement dans le logiciel Teamcenter, depuis la matrice de connectivité fonc-tionnelle d’un sujet individuel jusqu’au GMD préparé pour la méthode de visualisation OCL, est présentée dans la figure7.9.

Figure 7.8 – Exemples de requêtes personnalisées dans Teamcenter ; a) Recherche de sujet en fonction du genre et du résultat à un test psychologique et b) Recherche de donénes dérivées en fonction de plusieurs critères (sujets, acquisition d’entrée, etc).

Figure 7.9 – Provenance d’un GMD préparé pour l’exploration dynamique de la connectivité fonctionnelle cérébrale avec la méthode OCL. a) Chaîne de traitement depuis la matrice de connectivité d’un sujet, b) Provenance de la chaîne de traitement qui créé le GMD puis le prépare pour l’exploration OCL, c) Matrice de connectivité, d) GMD créé à partir des matrices d’adjacence des quatre groupes, e) GMD préparé pour la visualisation OCL affiché dans le logiciel SwoViewer.

7.2.2.4 Publication des résultats

L’étape 10 du cas d’utilisation concerne la publication des résultats d’une étude. Un statut est associé aux objets référence bibliographique : {draft,review,rejected,published}. Lors de la création d’une publication dans la base, son statut est draft. Si la publication n’est pas associée à une étude, l’utilisateur lance un workflow qui va modifier le statut à published. Si au contraire la publication est un article en ébauche, elle devra passer par le statut review quand l’article est soumis à un éditeur, et prendra le statut final de rejected si l’article est refusé, et de published s’il est accepté.

Le suivi d’un article scientifique depuis son ébauche à sa publication n’a pas pu être testée, car aucune publication n’était prévue dans l’intervalle d’expérimentation. Les acquisitions du projet I-share prévues pour fin 2015 vont permettre de tester l’intégralité de la chaîne depuis l’acquisition directe des données jusqu’à la publication des résultats issus de l’analyse des don-nées. Pour le moment, les objets référence bibliographique sont utilisés pour des publications existantes qui vont être référencées par des objets de définition. Un exemple est présenté dans la figure7.10; le test psychologique d’Edinburgh, qui permet de mesurer la latéralité d’un sujet, a été décrit dans un article de Oldfield en 1971.

Figure 7.10 – La publication (Oldfield,1971) dans Teamcenter avec le modèle de données BMI-LM. a) La publication est référencée par l’objet de définition du test d’Edinburgh dans la base de données, b) L’objet référence bibliographique représentant la publication, c) Métadonnées associées à la publication, d) Fichier pdf de l’article stocké dans la base de données.