• Aucun résultat trouvé

7 Aperçu de systèmes de RI médicaux

Dans le document The DART-Europe E-theses Portal (Page 96-102)

Les systèmes informatiques médicaux ont connu une grande évolution depuis ces deux der-nières décennies tant du point de vue de leur architecture que de la qualité et de la diversité des services autour du stockage de l’information, l’accès à l’information pertinente pour une médecine basée sur des niveaux de preuves, l’aide à la décision pour l’amélioration de la qualité des soins (Hersh, 2006). De ce fait, plusieurs moteurs de recherche ont été proposés, nous dé-taillons dans ce qui suit les quatre portails les plus utilisés dans le domaine médical :PubMed, EMERSE,CisMef etDoctissimo.

7.1 PubMed

PubMed est le moteur de recherche principal de données bibliographiques de l’ensemble des domaines de spécialisation de la biologie et de la médecine. Il a été développé par le centre américain pour les informations bio-technologiques (NCBI), et est hébergé par la bibliothèque américaine de médecine des instituts américains de la santé. PubMed est un moteur de recherche gratuit donnant accès à la base de données bibliographique MEDLINE, rassemblant des citations et des résumés d’articles de recherche biomédicaux.PubMed contient plus de 24 millions de citations et résumés de journaux biomédicaux et de santé. Les professionnels de santé considèrentPubMed comme une des plus importantes sources de preuves pour les soins de santé (Hauxet al., 1996). PubMed joue un rôle important dans le processus de découverte basée sur la littérature (Baker et Hemminger, 2010).

Le système PubMed inclut plusieurs fonctionnalités comme des champs d’exploration et de recherche, les termes MeSH (utilisés pour indexer les articles PubMed), des raccourcis et

des fonctionnalités utilisant l’historique de la recherche. Les données bibliographiques sont enregistrées dans des bases de données structurées concernant 65 domaines incluant les titres, résumés, auteurs, journaux, types de publication et dates de publication. PubMed fournit 48 tags de recherche dans les divers domaines de la base ; une description de chaque domaine est disponible sur le site NLM18. PubMed est donc un système de recherche orienté domaine avec les différents tags et annexes utilisant les opérateurs booléens (AND, OR, NOT). NLM indexe les documents PubMed en utilisant le vocabulaire MeSH. La Figure 2.5 présente une capture d’écran du système PubMed.

Figure 2.5 – Aperçu de domaines du système PubMed.

7.2 EMERSE

EMERSE (The Electronic Medical Record Search Engine) (Hanauer, 2006) est un moteur de recherche puissant et intuitif, pour la recherche de documents dans les dossiers électroniques médicaux (Hanauer, 2006). Il offre de multiples options pour créer des requêtes complexes pour réaliser la tâche de RI. Le moteur de recherche est idéal pour un examen rétrospectif des dossiers et revues ainsi que l’abstraction de données ; il peut également être utile pour les traitements cliniques. EMERSE concerne diverses tâches incluant la recherche clinique, l’amélioration de la qualité des initiatives ainsi que les tâches opérationnelles des hôpitaux.

Le système a été utilisé par les agents de conformité pour gérer les risques et par différents établissements de prévention des infections. Il offre plusieurs fonctionnalités permettant un travail rapide et à jour. Par exemple, il comprend une liste large de synonymes et de mots clés pour aider à étendre la recherche si la personne ne connait pas les termes appropriés à utiliser.

Cela inclut une large collection de noms de gènes, de médicaments, d’acronymes, d’abréviations et d’autres variations de mots prenant en compte même les fautes d’orthographe. La Figure 2.6 montre une capture d’écran du système EMERSE avec les termes d’expansion.

18. http ://www.nlm.nih.gov/bsd/mms/medlineelements.html

Figure 2.6 – Capture d’écran de EMERSE montrant les termes d’expansion du mot "cigarette".

7.3 CisMef

Le Catalogue et Index des Sites Médicaux Francophones (Darmoni et Joubert, 2000) du CHU de Rouen propose l’essentiel de la documentation biomédicale francophone en ligne (Figure 2.7). Il recense plus de 25248 documents (au 07/02/07) et sa mise à jour est hebdomadaire. Les documents sont classés selon le thésaurus MeSH. Il s’organise autour de 3 axes prioritaires :

— Ressources pour l’enseignement : cours, guides, QCM, cas cliniques, lecture critique d’ar-ticles, etc.

— Médecine factuelle (fondée sur des données validées) : recommandations de bonne pra-tique, conférences de consensus, méta-analyses, etc.

— Documents destinés aux patients et au grand public, pour participer à l’amélioration de l’éducation sanitaire.

Figure2.7 – Aperçu du système CisMef

CISMeF est l’outil de choix pour une recherche sur un sujet médical général, car son corpus est limité aux sites institutionnels, universitaires et aux sociétés savantes. La recherche s’effectue en deux étapes : (1) Sélectionner l’axe correspondant au type de recherche, et (2) utiliser la fonction "Terminologie", le descripteur MeSH en langue française, pour la sélection des mots-clés et des limites de la recherche. CISMeF permet également de trier les ressources par

type de documents et d’étendre la recherche (vers d’autres mots-clés ou d’autres moteurs de recherche).

7.4 Doctissimo

Doctissimo19 est un site Web francophone consacré à la santé et au bien-être. Le site comprend une encyclopédie médicale touchant à plusieurs domaines de santé, comme la grossesse, la forme, la nutrition, les médicaments, etc. Il propose également des articles sur différents phénomènes afin de répondre aux questions des utilisateurs sur un sujet de santé bien précis, par exemple pour arrêter de fumer ou encore les moyens pour perdre du poids.

Figure2.8 – Aperçu du site web Doctissimo.

Le site internet comprend des forums de discussions ce qui le rend interactif et permet d’être à jour sur les actualités et les questions du moment. La Figure 2.8 donne un aperçu des différents thèmes d’articles recherchés sur le site Doctissimo.

7.5 iMed

iMed est un moteur de recherche intelligent pour la recherche d’information médicale sur le web (Luo et Tang, 2008). C’est le premier moteur de recherche intelligent destiné à faciliter la tâche de la RI médicale, et qui utilise d’une manière extensive les connaissances médicales ainsi que les questionnaires interactifs. Ces derniers sont utilisés par le système pour guider les utilisateurs dans la formulation de leurs requêtes. De plus, iMed exploite les connaissances médicales à partir des réponses aux questions, pour constituer d’une manière automatiques un ensemble de requêtes susceptibles d’intéresser l’utilisateur. Dans (Luo, 2009), l’auteur a donné une évaluation du système en mettant en avant les avantages et les inconvénients, et a montré que iMed améliore considérablement la performance de recherche par rapport à d’autres systèmes comme Healthline etGoogle Health.

7.6 MedSearch

Proposé par (Luo et al., 2008), MedSearch20 est un moteur de recherche médical sur le web mis en place dans le but d’aider les utilisateurs à mieux formuler leur requêtes et à avoir des réponses pertinentes. Le système est basé sur un ensemble de techniques pour améliorer la qualité des résultats retournés, à savoir : (1) il accepte les requêtes longues des utilisateurs et

19. http ://www.doctissimo.fr/

20. http ://www.intelligence.tuc.gr/medsearch/

les transforme en requêtes courtes représentées par un ensemble de mots clés les plus repré-sentatifs, et (2) il offre divers résultats de recherche. MedSearch est un système de recherche complet utilisant la base MEDLINE, et différentes méthodes comme SSRM et VSM.

8 Conclusion

Ce chapitre donne un aperçu de l’état de l’art de la RI biomédicale. Nous avons donc présenté une typologie de l’information biomédicale, y compris la littérature biomédicale et les dossiers médicaux personnels. La littérature biomédicale a fait l’objet de nouveaux travaux de recherche en RI biomédicale, en particulier dans le cadre de TREC Genomics 2003-2007.

Nous avons donc décrit les principales ressources termino-ontologiques les plus utilisées dans le domaine. Les typologies des requêtes médicales sont présentées dans le contexte de la recherche d’information médicale. Nous avons présenté dans ce cadre les différents travaux de catégorisation de requêtes médicales.

Dans le cadre de la RI biomédicale, nous avons présenté en catégorisant les différentes approches existantes, à savoir l’approche basée sur l’expansion des requêtes, l’approche basée sur la reformulation de la requête PRF ainsi que l’approche basée sur l’expansion documentaire automatique ou manuelle. En particulier, nous avons présenté les différentes approches de la RI biomédicale, à savoir : l’expansion conceptuelle de la requête, l’expansion de la requête par la méthode PRF ainsi que l’expansion documentaire.

De plus, les nouveaux modèles d’appariement basés sur les patrons de besoins cliniques, appelés modèle PICO, peuvent être utiles afin de mieux cerner les besoins en information spécifiques aux professionnels de la santé. En effet, le modèle PICO représente plusieurs challenges dans le domaine du point de vue de l’ identification de ces éléments à partir des requêtes et des documents ainsi que leur utilisation dans la RI afin d’améliorer les systèmes de prise de décision médicale.

Enfin, nous avons présenté les campagnes d’évaluation spécifiques au domaine médical, comme TRECMed et TRECGenomics. Ces campagnes offrent des collections de test spé-cifiques au domaine en évoluant à travers les années afin d’évaluer au mieux les travaux proposés. Pour clôturer ce chapitre, nous avons donné un aperçu des systèmes de RI médicaux les plus utilisés dans le domaine et qui offrent une plateforme et interface de recherche avancées.

Nous allons présenter dans ce qui suit la deuxième partie du manuscrit qui comprend les deux chapitres de nos contributions dans le cadre de la RI médicale.

Dans le document The DART-Europe E-theses Portal (Page 96-102)