• Aucun résultat trouvé

2.4 Représentation de l’information médicale

2.4.1 Langage naturel en médecine

Une première caractéristique du langage naturel qui limite son traitement par l’ordinateur est l’absence de relation biunivoque entre le signifiant et le signifié : certains termes ont plusieurs sens (polysémie), certains contenus peuvent être si-gnifiés par plusieurs termes (synonymie). Le locuteur humain utilise le contexte lexical ou général (contexte d’énonciation) pour désambiguiser les termes polysé-miques mais il est difficile d’obtenir la même chose de l’ordinateur. La synonymie pose des problèmes lorsqu’il s’agit de chercher ou de réactiver des informations, susceptibles d’être désignées ou indexées de plusieurs manières différentes.

Ces problèmes existent en langage courant mais il sont démultipliés en méde-cine, notamment avec l’usage des acronymes qui sont source de polysémie. RPM peut signifier « rupture prématurée des membranes », « réflexe photomoteur », « ré-sidu post-mictionnel » ; FR tient lieu de « fréquence respiratoire », « facteur rhuma-toïde », « facteur de risque ». Cette polysémie ne prête généralement par à confusion car le médecin est capable de déterminer si l’acronyme est utilisé en contexte

obs-tétrical, neuro-ophtalmologique ou urologique. La situation est encore plus chao-tique avec les éponymes. Les conséquences de la polysémie sont manifestes lors de la recherche bibliographique. Ainsi, lancer la requête « Fanconi disease » (sans les guillemets) dans Pubmed retourne 1687 notices le 10/04/2013. Environ2/3des notices (103713) ont rapport à l’anémie de Fanconi, une maladie génétique compli-quée, entre autres, par une insuffisance de production des globules à l’âge adulte. La majorité du 1/3 restant des notices (54014) concerne le syndrome de Fanconi (parfois appelé syndrome de De Toni-Debré-Fanconi), caractérisé par les consé-quences d’une dysfonction du tubule proximal, avec fuite de glucose, de potassium, de phosphates et de bicarbonates dans les urines. Dans les notices restantes, on trouve par exemple les maladies de Zinsser-Engman-Cole-Fanconi, Illig-Fanconi ou Lignac-Fanconi, et les syndromes de Bickel, Wissler-Fanconi, Fanconi-Schlesinger, Fanconi-Albertini-Zellweger, Fanconi-Patrassi, Fanconi-Turler, Land-steriner-Fanconi-Andersen ou Fanconi-Hegglin.

Les éponymes sont particulièrement exposés à la synonymie. Premièrement, il existe des variants liés à l’usage ou non de la forme possessive en anglais (Jana et al., 2009) : « Down’s syndrome » ou « Down syndrome ». Deuxièmement, il existe une synonymie importante des éponymes entre eux : le syndrome de Lennox (états-Unis), celui de Gastaut (France) et celui de Doose (Allemagne) sont identiques. Troisièmement, un ou plusieurs termes descriptifs sont généralement associés aux éponymes. Ainsi, pour être exhaustive, une requête bibliographique sur les mots du texte devra comporter les termes « Lennox syndrome », « Gastaut syndrome », « Doose syndrome », leurs formes possessives (« Dooses’s syndrome ». . .), leurs combinaisons (« Lennox-Gastaut syndrome ». . .) et les termes descriptifs corres-pondants (« epileptic encephalopathy of childhood »). Certains médecins apprécient la flexibilité des éponymes, qui permettent d’étiqueter une maladie ou un syndrome encore mal démembré ou dont la physiopathologie n’est pas connue (Collier, 2012). Mais beaucoup regrettent leur proliférations, souvent dépourvue de justification his-torique, et leur préfèrent des désignations explicites (Woywodt et Matteson, 2007). La polysémie et la synonymie ne sont pas les seules difficultés relatives au trai-tement du texte libre en langage naturel par l’ordinateur. Le caractère vague des termes médicaux, c’est-à-dire de l’imprécision des frontières sémantiques, pose également problème. Tout le monde comprend ce qu’est qu’un infarctus du

myo-13. Requête : « Fanconi disease AND ("Fanconi anemia" OR "Fanconi anaemia" OR "aplastic anemia" OR "aplastic anaemia" OR "Fanconi pancytopenia") ».

carde mais il n’est pas évident d’en donner une définition logiquement cohérente et cliniquement sensée qui permette de décider de façon univoque dans tous les cas si oui ou non il s’agit d’un infarctus. Les conséquences ne sont pas limitées au traite-ment informatique, elle concernent égaletraite-ment la communication clinique (quand les locuteurs ne donnent pas exactement le même sens au même terme), la recherche clinique (quand les patients inclus dans une étude ne sont pas comparables aux patients inclus dans un autre alors que les termes employés pour les décrire sont identiques) ou l’évaluation des pratiques (quand un même terme diagnostique en-globe des réalités différentes dans deux services et autorise donc des différences de prise en charge).

Les termes doivent être standardisés pour autoriser un traitement informatique uniforme, mais ils doivent donc aussi être normalisés pour avoir un contenu uni-voque. Wlodzimirow et al. (2012) ont réalisé un inventaire de toutes les définitions de l’insuffisance hépatique aiguë utilisées dans les études pronostiques. Sur 103 études publiées en langue anglaise et référencées dans les bases de données bi-bliographiques Pubmed et Embase, 86 proposaient une définition conduisant à un total de 41 définitions distinctes. Quatre facteurs expliquaient la variabilité suivant leur prise en compte ou non et ses modalités : l’encéphalopathie hépatique, le délai maximal depuis les premiers signes, le retentissement sur la coagulation et l’ab-sence de maladie hépatique préexistante. Quelques études utilisaient en outre un ou plusieurs critère(s) supplémentaire(s) : ictère, insuffisance rénale, acidose, hy-poglycémie, astérixis. La variabilité de la définition n’était pas expliquée par une évolution au cours du temps ou par des spécificités d’école.

Des efforts de standardisation terminologique ont été réalisés et affichés, pour faciliter la pratique clinique, le codage de l’activité, l’évaluation des pratiques, la recherche clinique, et ce dans de nombreux domaines cliniques comme la rhuma-tologie (Zhang et al., 2011), la néphrologie (Gordon et al., 2009), l’ophtalmologie (Trusko et al., 2013). Dans la perspective du dossier patient informatisé, les car-diologues américains ont réalisé un effort de standardisation terminologique pour tous les concepts utiles en cardiologie générale (Weintraub et al., 2011) : démo-graphiques, sémiologiques, diagnostiques, thérapeutiques. Dans tous ces travaux, la terminologie rejoint la nosologie (Thygesen et al., 2012) : pour les maladies, de bonnes définitions correspondent à de bon critères diagnostiques15.

15. Par ailleurs, les choix terminologiques ont des conséquences pratiques. Un débat particuliè-rement animé oppose les opposants du dépistage généralisé du cancer de la prostate à ses partisans. Les arguments contre sont assez éloquents : il n’y a aucun bénéfice associé au traitement des cancers dépistés avant les symptômes avec en contrepartie un morbidité importante liée au surtraitement. Les

Nous avons uniquement abordé dans ce survol le problème de la référence des termes. Le langage médical a d’autres spécificités liées à l’agencement des termes. Les notes d’observation se caractérisent par exemple par un manque de respect des règles de grammaire (style télégraphique) qui n’entrave habituellement pas leur compréhension par un lecteur humain et permet de réduire leur taille (et donc le temps passé à les saisir). Le langage médical est également riche en constructions métonymiques, ou le tout représente la partie : « la sténose de ce patient est serrée » ne fait pas référence à un patient sténosé, mais à un patient porteur d’une sténose d’artère rénale qui a comme caractéristique d’être serrée. L’énoncé rectifié est le suivant : « la sténose de l’artère rénale gauche de ce patient est serrée ». Là encore, la rigueur est sacrifiée, peut-être à juste titre, à l’efficacité de la communication.