• Aucun résultat trouvé

2.2.1 La littérature biomédicale . . . 46 2.2.2 Les dossiers médicaux des patients . . . 48 2.3 Quelques ressources termino-ontologiques du domaine biomédical . . . 48 2.3.1 Thésaurus MeSH . . . 49 2.3.2 Méta-thésaurus UMLS . . . 50 2.3.3 Nomenclature SNOMED . . . 51 2.3.4 Gene Ontology GO . . . 51

3 Étude des besoins en information médicale . . . . 52

3.1 Catégories de requêtes médicales . . . 53 3.2 Caractéristiques des requêtes médicales . . . 56 3.2.1 Caractéristiques selon les utilisateurs . . . 57 3.2.2 Caractéristiques linguistiques . . . 59 3.2.3 Sujet de la requête . . . 61 3.3 Stratégies et comportements de recherche . . . 62

4 Techniques et modèles de RI médicale . . . . 65

4.1 Expansion de requêtes . . . 65 4.2 Expansion de documents . . . 67

5 Modèles de RI basées sur le paradigme PICO . . . . 68

5.1 EBM et paradigme PICO . . . 68 5.2 Identification des éléments PICO . . . 72 5.3 Modèles de RI basés sur les facettes PICO . . . 75

6 Campagnes d’évaluation pour la RI biomédicale . . . . 78

6.1 Campagne d’évaluation TREC . . . 78 6.2 Campagne d’évaluation ImageCLEF . . . 81

7 Aperçu de systèmes de RI médicaux . . . . 83 7.1 PubMed . . . 83 7.2 EMERSE . . . 84 7.3 CisMef . . . 85 7.4 Doctissimo . . . 86 7.5 iMed . . . 86 7.6 MedSearch . . . 86 8 Conclusion . . . . 87

1

Introduction

Les progrès technologiques et le poids croissant des facteurs sociaux et économiques de pro- duction de l’information ont profondément transformé le fonctionnement et le comportement des utilisateurs dans le domaine de la RI médicale. En effet, la médecine est un champ d’information-intensive. Comme l’accès à l’information pertinente et en un temps limité est essentiel pour délivrer des services de santé efficaces, la médecine est ainsi dépendante de la technologie de l’information et plus spécifiquement des SRI médicaux. Une grande partie des données médicales disponibles aujourd’hui est sous forme non structurée, à savoir texte libre. La recherche et l’interprétation de ces données présente des défis spécifiques au domaine médical. Au cœur de ces défis est le problème du "fossé sémantique", défini comme la différence entre les informations brutes et la façon dont un être humain peut les interpréter. Par ailleurs, le développement d’internet a transformé l’accès à l’information médicale. En effet, des études larges et exhaustives menées par Pew Internet and American Life Project révèlent que 80% des utilisateurs cherchent l’information de santé en ligne et que l’information retournée impacte leurs décisions quant à la prise en charge de leur propre santé ou celle de leurs proches (Fox et Jones, 2009). En outre, ces études montrent que la population d’utilisateurs est caractérisée par une variabilité significative à la fois sur le volet de l’âge que du niveau d’expertise ; les besoins en information liés à la santé sont également très variés couvrant des besoins liés à la médication, santé et bien-être, traitements et pathologies. Malgré la diversité des SRI, qu’ils soient généraux ou dédiés tel que PubMed1, ainsi que la multiplicité des sources d’information, les utilisateurs demeurent insatisfaits de la pertinence des résultats retournés par ces systèmes (Zhang, 2010). En effet, formuler des requêtes claires et qui reflètent le besoin en information spécifique est une tâche difficile pour les experts ainsi que les novices du domaine médical (Spink et Jansen, 2006; White et Moris, 2008). Plus spécifiquement, dans le cadre de la recherche médicale experte, médecins et cliniciens ont été éduqués à formuler des questions cliniques selon la structure PICO qui désigne Population/- Problem, Intervention, Comparison et Outcome (Boudin et al., 2010b; Boudin et al., 2010a). Cette structure a été introduite dans le cadre de la médecine basée sur les faits afin d’aider les praticiens à poser des questions bien structurées et à trouver les meilleures preuves leur per- mettant une prise de décision optimale. Néanmoins, malgré de nombreux travaux du domaine (Schardt et al., 2007; Boudin et al., 2010b; Chabou et Iglewski, 2015), accéder à l’information pertinente reste une tâche difficile dans le domaine médical.

Nous décrivons dans la section qui suit les fondements de la RI médicale, en passant en revue les enjeux du domaine, la typologie de l’information médicale ainsi que quelques ressources terminologiques. La section 3 présente les travaux sur les besoins en information médicale, répartis selon trois sous-sections, à savoir : (1) typologie des requêtes médicales, (2) caracté- ristiques de ces requêtes et les stratégies de recherche ; et (3) comportement de recherche d’in- formation des utilisateurs. Nous détaillons plus précisément les besoins des experts médicaux. Différentes approches concernant l’expansion des requêtes et des documents sont présentées dans la section 4. Nous détaillons par la suite dans la section 5 les travaux portant sur la RI basée sur le paradigme PICO. Dans la section 6, nous passons en revue les principales cam- pagnes d’évaluation du domaine médical. Enfin, la section 7 donne un aperçu sur les systèmes de RI médicaux.

2

Aperçu du domaine de la RI médicale

2.1 Enjeux et défis du domaine

La RI médicale se réfère à des méthodologies et des technologies qui visent à améliorer l’accès aux archives d’informations médicales via un processus de RI. Ces informations sont potentiellement accessibles à partir de nombreuses sources, y compris le Web en général, les médias sociaux, des articles de journaux, et les dossiers hospitaliers. Le contenu médical, ainsi que l’information sur la santé est le sujet le plus abordé par les utilisateurs sur internet (Sadasivam et al., 2013), ce qui rend ce domaine important pour les travaux de RI. L’information médicale est d’intérêt à un large éventail d’utilisateurs, y compris les patients et leurs familles, les chercheurs, les médecins généralistes, les cliniciens et les praticiens ayant une expertise spécifique. De ce fait, il existe plusieurs services dédiés qui cherchent à rendre cette information plus facilement accessible, tels que les systèmes de recherche médicaux sur internet "Health on the Net", destinés au public général et aux praticiens2.

Malgré la popularité du domaine médical pour les utilisateurs de moteurs de recherche, et de l’intérêt actuel qu’accorde la communauté en RI à ce sujet, le développement des technologies de recherche et d’accès demeure particulièrement difficile et sous exploré. Un des problèmes principaux dans le domaine de la RI médicale est la diversité des utilisateurs de ces services, correspondant à des différences dans les types et les champs de leurs besoins individuels. Autrement dit, la nature de la question médicale dépend des objectifs des utilisateurs, qui ont généralement des niveaux de connaissance médicale très variés. Ces compétences sont en étroite relation avec le comportement des utilisateurs ainsi que leur stratégie de recherche lors de la tâche de RI.

Ces défis peuvent être résumés comme suit :

1. La diversité des besoins en information (Clarke et al., 2013; Dixon et al., 2013) : Un patient avec une maladie récemment diagnostiquée bénéficie généralement d’une in- formation introductrice à sa maladie et son traitement. Les patients vivants avec une maladie et qui essayent de gérer leur état de santé à long terme sont, quant à eux, à la recherche d’une information plus avancée, ou encore de groupes de discussion et de forums de santé.

De la même façon, un médecin généraliste a besoin de l’information de base rapidement pendant une consultation pour conseiller le patient, mais d’une information plus détaillée lors de la prise de décision pendant la consultation. Cependant, un clinicien spécialiste pourrait chercher/être intéressé par une liste exhaustive de cas semblables ou de do- cuments/articles scientifiques liés au cas des patients qui cherchent a être conseillés et guidés. Comprendre les différents types d’utilisateurs et leurs besoins en information est l’un des enjeux de la RI médicale. Ainsi, adapter le processus de RI pour mieux traiter ces besoins en vue de développer des systèmes efficaces, potentiellement personnalisés, est un des plus grands défis du domaine.

2. Connaissances médicales différentes (Zickuhr, 2006) : Les différentes catégories d’utilisateurs de SRI médicaux ont des niveaux très variés de connaissances médicales. De plus, la connaissance médicale des différents individus au sein de la catégorie d’uti- lisateurs peut varier considérablement. Cela affecte la façon avec laquelle les personnes

soumettent les requêtes au système et aussi le niveau de complexité de l’information qui doit être retournée, ou encore le type de support pour la compréhension et la désambi- guisation qui s’avère nécessaire pour appréhender les résultats de recherche.

3. Compétences linguistiques différentes (Pang et al., 2014) : Étant donné les différents profils d’utilisateurs, experts ou néophytes, la tâche de RI reste une tâche difficile. En effet, les experts médicaux comme les praticiens médecins et professionnels de santé se focalisent sur la structure PICO pour formuler leurs questions. De plus, ils se basent sur leurs connaissances du domaine en utilisant des ressources externes comme les ontologies du domaine. Cependant, les utilisateurs néophytes comme les patients et leurs familles, manifestent des difficultés dans la tâche de recherche dans les choix des termes.

Ainsi, plusieurs problèmes se posent, nous citons les plus abordés par la communauté de RI : — La quantité importante de littérature médicale (Nourbakhsh et al., 2012; Califf et al., 2013). Prenant l’exemple de Entrez3 qui publie des références de plus de 34000 journaux chaque année (plus d’un million d’articles de journaux au total). Cela rend la tâche de trouver l’information spécifique au besoin en information difficile.

— Expression des besoins en information d’une manière inadéquate (Soldaini et al., 2015c; Hanbury, 2012). La plupart du temps, les médecins ignorent leur besoin en information, ce qui rend difficile d’exprimer leur besoin avec des requêtes appropriées. Par ailleurs, exprimer des requêtes claires et spécifiques, par les experts ou les non experts du domaine médical demeure une tâche compliquée.

— La nature de la tâche de RI médicale avec la contrainte du temps "Time-

consuming" (Keenan et al., 2013). En raison de la grande quantité de littérature médi-

cale, le temps nécessaire pour trouver les documents pertinents dans la littérature liés aux patients s’est considérablement élargi. Dans la plupart des cas, le processus de collecte prend plus de temps que le médecin peut épargner. Selon (Merry et Korsmeyer, 1997), une tâche de recherche de plus de 30 secondes n’est pas acceptable pour les médecins.