• Aucun résultat trouvé

Analyse et évaluation de requêtes médicales

Dans le document The DART-Europe E-theses Portal (Page 102-108)

Introduction

La communauté des utilisateurs d’informations médicales est extrêmement variée selon plu-sieurs critères tels que, sa facon d’exploiter l’expertise dans la recherche, sa familiarité avec les différents vocabulaires d’indexation biomédicale et ses exigences en matière d’utilisation de l’information. Par exemple, l’expertise biomédicale varie entre les patients et les familles qui sont confrontés à des notions et des termes médicaux pour la première fois, à des spécia-listes dans des domaines de recherche ciblés qui sont considérés comme des experts. Dans le domaine biomédical, l’analyse des besoins en information des utilisateurs de SRI biomédicaux ont été abordés sous l’angle de l’étude des stratégies de recherche d’une part et de l’analyse des requêtes d’autre part. De nombreux travaux ont cependant révélé des stratégies typiques des utilisateurs de SRI médicaux dépendantes de leur niveau d’expertise (Bhavnani, 2002).

Dans le cadre de la RI sur le web les auteurs de (Eysenbach et Köhler, 2002) ont montré que les groupes de personnes qui cherchent l’information pour évaluer la crédibilité d’un site web, regardent la source, la conception, la langue utilisée et la facilité d’utilisation. Par ailleurs, les auteurs de (Haynes et al., 2005) ont analysé des critères associés aux termes des requêtes cliniques ; ils ont identifié 4 critères stratégiques : la sensibilité, la spécificité, la précision et la justesse des termes.

D’une manière globale, l’expression des requêtes traduisant les besoins en information spéci-fiques est une tâche difficile aussi bien pour des novices que pour des experts (Spink et al., 2004; White et Moris, 2008). En effet, avec la diversité des ressources disponibles en ligne ainsi que la multiplicité des SRI médicaux, il est difficile de trouver l’information pertinente. Cela est dû à deux problèmes majeurs : d’une part, la difficulté de formuler une requête claire, et l’interprétation des besoins en information induits par les SRI, d’une autre part. En effet, les utilisateurs se caractérisent par une variabilité significative à la fois sur le volet de l’âge que sur le niveau d’expertise, les besoins en information liés à la santé sont également très variés, couvrant des besoins liés à la médication, santé et bien-être, traitements et pathologies.

Plus proche de notre domaine d’étude, la tâche de recherche conduite par les experts a été étudiée dans le contexte de l’analyse du besoin exprimé par la formulation de requête. Cette analyse concerne les caractéristiques des requêtes lors de la formulation du besoin en infor-mation, comme le nombre de termes, le nombre de concepts, le vocabulaire utilisé, etc. D’une autre part, cela comprend le comportement de recherche comme le facteur temps, la naviga-tion, la re-formulation de requête, etc.

Concernant la forme des requêtes, trois principales conclusions émergent des études anté-rieures, à savoir : (1) les requêtes médicales sont courtes (Honget al., 2002; Zenget al., 2002b;

Natarajan et al., 2010; Tracy Edinger et al., 2012), (2) les termes de la requête ne sont pas fortement liés aux vocabulaires médicaux (Yanget al., 2011; McCray et Tse, 2003), et (3) les sujets des requêtes sont ambigus (Songet al., 2010; Liuet al., 2012).

D’après notre état de l’art du domaine, peu de travaux se sont intéressés à des analyses spé-cifiques à la caractérisation des requêtes des experts médicaux, considérant une population spécifique d’utilisateurs ainsi que le contexte de la tâche de RI. Dans ce contexte, nous nous intéressons à l’analyse des besoins en information exprimés par les experts médicaux, nous traitons un axe de recherche dans le chapitre 3 qui concerne les analyses exploratoires des requêtes expertes via l’analyse des attributs de requêtes. Nous formalisons un ensemble d’at-tributs de requêtes, à savoir : la longueur en nombre de termes, la longueur en nombre de concepts, la spécificité terme-document, la spécificité hiérarchique, la clarté de la requête ba-sée sur la pertinence et la clarté baba-sée sur le sujet de la requête. Ces attributs sont utilisés dans

le cadre d’une méthodologie statistique dans le but de caractériser le besoin en information des experts et de mesurer l’impact de leur structure sur les résultats de recherche.

Un deuxième volet de contribution concerne la RI dans le cadre de la médecine basée sur les faits et preuves médicales. L’EBM consiste à fonder les décisions cliniques sur des connaissances théoriques et sur les preuves scientifiques tout en tenant compte des préférences des patients.

La médecine basée sur les preuves est conçue comme une méthodologie explicite de recherche de meilleures preuves disponibles pour résoudre un problème clinique, elle s’effectue en quatre étapes :

1. la formulation du problème médical en une question claire et précise.

2. la recherche dans la littérature des articles les plus pertinents en rapport avec la question posée.

3. l’évaluation de la fiabilité et l’applicabilité des conclusions extraites des articles retenus, la pertinence clinique.

4. l’intégration des conclusions retenues pour répondre à la question initiale posée.

Ces étapes présentent la démarche systématique de l’EBM. La question se formule selon le modèle PICO élaboré par la Cochrane Collaboration. Les questions posées concernent le diagnostic, l’étiologie, le traitement, le pronostic selon le modèle PICO comme suit :

P : Patient (âge, sexe..) et le problème qu’il poseWho is affected ?

I: Intervention qu’est ce qui est envisagé ? Qu’est ce qui est fait ? L’intervention envisagée peut être une méthode de diagnostic ou de traitement.

C: Comparaison par rapport à une autre intervention,How effective are different inter-ventions ?

O :Output qui représente l’issue clinique recherchée,Does it work ?

De nombreux travaux (Schardt et al., 2007; Boudin et al., 2010a; Boudin et al., 2010b;

Boudin et al., 2010d) se sont intéressés à l’identification de ces éléments PICO à partir des requêtes et des documents dans le contexte de la RI médicale. Cette phase est primordiale pour une utilisation optimale de ces facettes dans les modèles de RI médicaux. Un deuxième volet des travaux est l’utilisation des éléments PICO dans la RI médicale. Peu de travaux ont été proposés dans ce cadre (Boudin et al., 2010d), vu la complexité de l’identification pertinente des facettes à partir du texte, ainsi que la mise en évidence des preuves et leur intégration dans un modèle de RI qui intègre le contexte de recherche spécifique et assure la pertinence des résultats pour la prise de décision médicale.

Dans ce contexte, nous nous intéressons particulièrement dans cette partie du manuscrit, à la problématique de répondre au mieux aux questions cliniques PICO, qui comporte une identification explicite de ces facettes et leur utilisation dans la recherche d’information.

Dans ce cadre, nous présentons nos contributions sous forme de trois sections dans le chapitre 4 :

— Une représentation sémantique sous forme de graphes des requêtes PICO. Nous proposons pour cela un algorithme de génération de graphes conceptuels.

— Une approche d’expansion sémantique de requêtes pour mieux répondre aux questions PICO. Pour atteindre cet objectif, nous avons proposé deux algorithmes : un premier algorithme permettant de sélectionner les meilleurs concepts à partir des graphes sé-mantiques, un deuxième algorithme pour l’expansion de requêtes en se basant sur une approche de propagation de scores.

— Une méthode d’ordonnancement des documents permettant de calculer les scores de pertinence selon une approche d’agrégation prioritaire des scores selon les facettes PICO.

Dans le chapitre 3, nous détaillons les facteurs caractéristiques des requêtes expertes et les mé-thodes statistiques utilisées pour nos analyses exploratoires ainsi que l’étude de l’impact de ces facteurs sur la pertinence des résultats. Dans le chapitre 4, nous présentons nos contributions visant à mieux répondre aux requêtes PICO.

Chapitre 3

Analyses statistiques exploratoires

Dans le document The DART-Europe E-theses Portal (Page 102-108)