Évaluation des requêtes cliniques : Modèles sémantiques pour mieux

ré-pondre aux questions PICO

Sommaire

1 Introduction . . . 123 2 Motivations et hypothèses . . . 125 3 Aperçu général de nos contributions . . . 127 4 Processus d’élicitation sémantiques des requêtes PICO . . . 128 4.1 Méthode de génération de graphes . . . 128 4.2 Identification de concepts les plus pertinents . . . 130 5 Évaluation des requêtes cliniques . . . 133 5.1 Expansion sémantique des requêtes cliniques . . . 133 5.2 Modèle d’ordonnancement basé sur un opérateur d’agrégation prioritaire des

scores . . . 135 5.2.1 Cadre général . . . 135 5.2.2 Calcul de scores de pertinence des documents . . . 136 6 Évaluation expérimentale . . . 137 6.1 Données expérimentales . . . 137 6.2 Évaluation de l’approche d’expansion de requêtes . . . 137 6.2.1 Métriques d’évaluation et modèles de référence . . . 137 6.2.2 Ajustement des paramètres . . . 138 6.2.3 Analyse de l’efficacité de la recherche : évaluation comparative . . 140 6.2.4 Discussion . . . 140 6.3 Évaluation du modèle d’ordonnancement de documents . . . 141 6.3.1 Objectifs . . . 141 6.3.2 Métriques et protocole d’évaluation . . . 141 6.3.3 Efficacité du modèle de pertinence basé sur l’agrégation des scores 142 6.3.4 Analyse de la robustesse du modèle d’agrégation de pertinence . . 143 6.3.4.1 Analyse globale . . . 144 6.3.4.2 Analyse au niveau requête . . . 146

7 Bilan et conclusion . . . 149

1 Introduction

De nombreuses études ont clairement montré que la recherche d’information médicale est lar-gement pratiquée aussi bien par des experts que par des novices (Fox et Duggan, 2013; Zhang, 2014). Plus spécifiquement, la recherche d’information médicale pratiquée par les experts est une recherche verticale basée sur l’usage de ressources, comme les dossiers médicaux de patients ou la littérature scientifique médicale (e.g., MEDLINE¹, Cochrane²), en vue de répondre à différents objectifs comme l’aide au diagnostic, l’aide à la prescription médicale ou encore la recherche clinique.

Ce type de besoins en information induit en grande partie l’évaluation de requêtes cliniques qui ont pour objectif de sélectionner, à partir de la littérature scientifique du domaine, des procédés cliniques et/ou des preuves d’études systématiques (Yang et al., 2011). Plus globalement, les tâches de recherche d’information cliniques expertes sont généralement conduites par les cliniciens dans le cadre de la médecine basée sur les faits connue sous l’acronyme EBM (Evidence-Based Medicine) (Sackett et al., 1996). Cette dernière consiste à utiliser de manière rigoureuse, explicite et judicieuse, les preuves scientifiques les plus récentes et plus pertinentes lors de la prise de décision concernant les soins à prodiguer à chaque patient. Sa pratique implique que l’on conjugue l’expertise clinique individuelle avec les meilleures preuves cliniques externes obtenues actuellement par la recherche systématique (Sackett et al., 1996).

La recherche de ces meilleures preuves d’études cliniques, à partir de la littérature scientifique, est, à juste titre, l’objet de notre contribution présentée dans ce chapitre. Cela suppose d’abord la formulation d’un besoin en information clinique. Selon l’approche EBM, un moyen qui a été proposé aux experts en vue de clarifier leur besoin est de structurer leur requête selon la forme PICO, à savoir : Patient/Problem (P), Intervention (I), Comparison (C) et Outcome (O), appelés les éléments ou facettes PICO (Schardt et al., 2007) détaillés dans le précédent chapitre.

En plus du verrou largement reconnu lié à l’ambiguité des expressions médicales et acronymes (Trieschnigg, 2010), l’évaluation de ce type de requêtes pose deux difficultés supplémentaires et non triviales à surmonter : (1) considérer la structure de la requête en facettes dans le processus d’appariement avec des documents qui ne sont pas ainsi structurés ; et (2) considérer leur im-portance relative dans l’estimation du score de pertinence. À notre connaissance, c’est un champ d’investigation peu exploré ; on recense en effet peu de travaux qui ont abordé spécifiquement le problème d’évaluation des questions cliniques PICO (Boudin et al., 2010c; Boudin et al., 2010b;

Demner-Fushman et Lin, 2007). Dans l’ensemble des travaux précédents, une étape préliminaire à la recherche est la détection des facettes PICO dans les documents. Au niveau de l’appariement requête-document, les auteurs dans (Demner-Fushman et Lin, 2007), se sont basés sur une approche d’appariement sémantique entre les types sémantiques extraits d’UMLS de chacune des facettes détectées dans les requêtes et les documents. Cependant, cette méthode ne prend pas en compte l’importance des facettes PICO dans le texte, lors du calcul des scores de pertinence.

Cependant, plusieurs problèmes empêchent le développement et l’implémentation des meilleures preuves dans la pratique clinique (Franckeet al., 2008). Ces problèmes proviennent principalement de :

1. https ://www.nlm.nih.gov/bsd/pmresources.html accessible à l’aide PubMed

2. http ://www.ncbi.nlm.nih.gov/pubmed, Cochrane http ://www.cochranelibrary.com/

1. La complexité d’exprimer une requête précise, spécifique au contexte de la recherche permet-tant d’identifier facilement les preuves pertinentes ;

2. L’absence du niveau de compétence qui peut être utilisé pour effectuer l’évaluation des preuves.

Nous nous intéressons dans le contexte de nos recherches au premier problème.

Dans Boudin et al. (Boudin et al., 2010c), les auteurs ont proposé un modèle d’appariement qui considère l’importance de chaque facette PICO pour calculer le score de pertinence des documents.

Toutefois, les scores d’importance sont calculés d’une manière statique, sur la base de la distribution des mots appartenant à chaque facette sur l’ensemble de la collection de documents.

Dans ce contexte de recherche, nous proposons un modèle d’appariement requête PICO-document, qui, à la différence des précédents travaux, (1) ne requiert pas l’identification préalable des facettes P, I, C et O dans les documents ; et (2) utilise un opérateur d’agrégation prioritaire (Da Costa Pereira et al., 2009) dans le calcul des scores d’appariement requête-document en personnalisant les poids de chaque facette selon la requête et le document en cours d’évaluation.

Comme dans (Demner-Fushman et Lin, 2007), nous privilégions une représentation sémantique des requêtes et documents, qui est cependant basée sur la génération de graphes sémantiques par facette.

Ainsi, notre objectif est de contribuer à ce domaine de recherche qui reste insuffisamment exploré avec l’espoir de concevoir les systèmes de RI qui assistent les cliniciens dans leur pratique quoti-dienne de l’EBM. Les travaux pionniers de la littérature (Demner-Fushman et Lin, 2007; Boudin et al., 2010c; Boudin et al., 2010b) nous ont permis de conclure que les différentes techniques proposées reposent sur deux étapes principales, à savoir : (1) la détection des facettes PICO à partir des requêtes et des documents compris dans les entrepôts scientifiques médicaux ; et (2) l’intégration des éléments PICO dans le modèle d’appariement document-requête.

Cependant, nous proposons d’aborder la problématique différemment de la manière suivante : (1) faciliter les conditions d’identification des éléments PICO à partir des documents ; et (2) résumer la formulation de la question clinique en mettant en relief une image sémantique de chaque facette PICO.

À ce titre, nous proposons d’étendre séparément chaque facette de la question en utilisant les concepts extraits des documents les mieux classés. Ce classement est donné au préalable par un modèle de RI. Notre intuition est que ces documents comportent des indices de contexte utiles qui permettent de distinguer les documents pertinents des documents non pertinents en se basant sur ces différentes facettes.

La suite du chapitre est organisée comme suit : dans la section 2, nous donnons quelques motivations et les hypothèses de recherche. Ensuite, nous détaillons l’approche de l’élicitation sémantique des questions cliniques PICO dans la section 3, où nous proposons deux algorithmes : (1) un algorithme de génération de graphes sémantiques conceptuels, et (2) processus d’identification de concepts qui représentent au mieux les preuves cliniques entre la question et les documents. La section 4 détaille nos méthodes d’évaluation des requêtes cliniques, composée de deux sous-sections : la section 4.1 décrit l’approche d’expansion sémantique conceptuelle des requêtes ; et la section 4.2 détaille le modèle d’ordonnancement de documents basé sur l’agrégation prioritaire des scores pour calculer le score de pertinence des documents. Enfin, l’évaluation expérimentale menée dans l’objectif d’évaluer

la pertinence de nos contributions est détaillée dans la section 5. Nous présentons un bilan et concluons dans la section 6.

Dans le document The DART-Europe E-theses Portal (Page 134-138)