• Aucun résultat trouvé

CLEF est en évolution permanente et couvre différentes tâches de recherche d’images. Parmi plusieurs pistes d’évaluation, la piste ImageCLEF apparait pour la première fois en 2003, et a pour principal objectif d’encourager l’évolution dans différents domaines comme l’analyse des médias visuels, l’indexation, la classification et la RI. Elle fournit pour cela une infrastructure pour l’évaluation des SRI que ce soit par le contexte ou par le contenu. Cela a impliqué la définition de diverses sous-tâches qui varient d’une année à une autre. Par exemple, en 2012 les quatre sous-tâches définies dans ImageCLEF 2012 sont : recherche de cas de patients, recherche d’images et classification de modalités.

La tâche de recherche de cas de patients a été introduite pour la première fois en 2009, et a pour but de rechercher les cas de patients incluant des images qui répondent potentiellement à un cas clinique. Contrairement à la tâche ad-hoc, l’unité de recherche est le cas de patient et non l’image. Pour cet objectif, un cas est un identifiant PubMed "ID" qui correspond à un article de journal. Les documents sont constitués du texte intégral y compris les légendes des photos biomédicales. Les requêtes sont constituées d’une description de cas de patients, avec la démographie, les symptômes et les résultats de tests y compris les études des imageries. Quelques statistiques sur les collections ImagesCLEF (case-based retrieval) sont présentées dans le Tableau 2.20.

La tâche Image-CLEF médicale lancée en 2004 par (Müller et al., 2007) se base sur l’utilisation de l’information multimodale (images et texte) dans le domaine médical. Depuis 2009, la tâche de la recherche des cas de patients (case-based retrieval) a été introduite, avec pour objectif de promouvoir la recherche des diagnostics. Le but principal de cette tâche est de récupérer les cas de patients incluant des images que les médecins jugent pertinentes ou pas par rapport aux différents diagnostics. En gros, l’objectif de cette tâche est de fournir au clinicien qui a formulé la requête une aide afin de lui permettre de prendre une décision pertinente sur un diagnostic ou un traitement considérant un cas difficile. Les requêtes sont créées à partir

d’une base médicale de cas incluant des descriptions en langage naturel des cas médicaux de patients, avec la démographie des patients, les symptômes, les résultats des tests et les études des images. Par exemple une requête peut être : "A 49-year-old woman with a prolapsed mass in the opening of her urethra. Pelvic CT shows a heterogeneously enhanced mass on the female urethra. Pathology shows ramifying papillae, high nuclear/cytoplasmic ratio, and brisk mitotic activity".

Année Nb. de requêtes Nb. de documents Nb. documents pertinents

2009 5 5706 95

2010 14 77,506 95

2011 10 55,635 521

2012 26 74,654 247

2013 35 74,654 709

Tableau 2.20 – Statistiques des collections ImageCLEF (Case-based IR)

Les tâches de la campagne ImageCLEF sont différentes d’une année à l’autre. Par exemple, pour l’année 2011, plusieurs tâches ont été proposées, nous citons :

— La recherche médicale : elle comprend des tâches de classification d’images et de textes ainsi que la recherche adhoc des images et des cas de patients (Kalpathy-Cramer et al., 2011).

— L’annotation d’images : c’est une tâche d’annotation de de détection visuelle des concepts. Elle de divise en deux sous-tâches : (1) l’annotation, et (2) la recherche basée sur les concepts.

— L’identification de plantes : l’objectif principal de cette tâche est d’associer les espèces de plantes à l’image correspondante.

— La recherche Wikipédia : l’objectif est d’étudier les approches de RI dans le cadre d’une grande collection hétérogène d’images et de textes issus des besoins en information ex- primés par les utilisateurs.

Un des défis les plus connus dans le domaine de la RI médicale est de répondre aux questions des patients (Burstein et al., 2005) dans un format compréhensible par les utilisateurs néophytes. Les prescriptions médicales et les résumés de décharge sont écrits dans la termi- nologie médicale professionnelle qui n’a aucun sens pour l’utilisateur final (patient). Pour cette raison, la communauté ShARe/CLEF a proposé la tâche eHealth en 2013 (Suominen et al., 2013) avec l’objectif de développer un tel système en attirant les jeunes chercheurs de diverses organisations et universités du monde de l’informatique et du domaine biologique ; et présente une plate-forme commune pour mener la recherche. De plus, le but est d’évaluer les systèmes qui assistent les utilisateurs néophytes dans leur recherche et la compréhension de l’information médicale.

La campagne ShARE/CLEF eHealth 2014 (Kelly et al., 2014) comprend trois tâches princi- pales, à savoir :

— Tâche 1 - Visualisation de l’information : la première tâche de CLEF eHealth 2014 (Kelly et al., 2014) vise à fournir une visualisation de l’information médicale extraite des résumés de décharge de manière convenable et compréhensible pour les néophytes du domaine médical ;

— Tâche 2 - Extraction de l’information : cette tâche nécessite la normalisation et l’expan- sion des abréviations et des acronymes présents dans les résumés de décharge. Le cas d’utilisation suppose que, compte tenu des résumés de décharge et les troubles diagnos- tiqués, les patients ont souvent des questions au sujet de leur état de santé (Zhu et al., 2013) ;

— Tâche 3 - Recherche d’information : l’objectif de la troisième tâche (Goeuriot et al., 2014; Goeuriot et al., 2013) est de fournir des documents utiles et pertinents pour les patients, en développant un système de recherche médical centré sur l’utilisateur ou basé sur le contexte de manière à satisfaire leurs besoins en informations médicales.

Avec l’évolution dans ce domaine, eHealth 2015 (Goeuriot et al., 2015) s’est focalisé sur les cliniciens qui ont des problèmes à comprendre le jargon médical. Cette campagne propose deux tâches, à savoir : (1) extraction de l’information à partir du texte clinique ; et (2) la RI centrée sur l’utilisateur. Le Tableau 2.21 donne des statistiques sur les différentes collections de eHealth.

Année Nb. de requêtes Nb. de documents Nb. documents pertinents

2013 50 1 million 37

2014 50 1 million 64

2015 66 1 million 66

Tableau 2.21 – Statistiques des collections CLEF eHealth.

7

Aperçu de systèmes de RI médicaux

Les systèmes informatiques médicaux ont connu une grande évolution depuis ces deux der- nières décennies tant du point de vue de leur architecture que de la qualité et de la diversité des services autour du stockage de l’information, l’accès à l’information pertinente pour une médecine basée sur des niveaux de preuves, l’aide à la décision pour l’amélioration de la qualité des soins (Hersh, 2006). De ce fait, plusieurs moteurs de recherche ont été proposés, nous dé- taillons dans ce qui suit les quatre portails les plus utilisés dans le domaine médical : PubMed, EMERSE, CisMef et Doctissimo.