L’ Les systèmes d’aideà la décision médicale

(1)

à la décision médicale

Mireille Cléret – Pierre Le Beux Franck Le Duff

ampleur et la complexité croissante des connaissances médicales, telles que les données physiopathologiques ou les moyens diagnostiques et thérapeutiques, obligent le médecin à gérer toujours plus d’informations pour soigner un patient. Une réponse à cet état de fait peut être une plus grande spécialisation des médecins mais ils ne peuvent être réunis simultanément et cette surspécialisation peut entraîner des pertes de temps et des dérives liées à la « segmentation » du patient.

Lorsqu’il soigne un patient, le médecin doit prendre toute une série de décisions aboutissant à l’acte médical. Il agit en suivant un raisonnement qui implique tout à la fois des notions de connaissance, d’incertitude, d’expérience et de risque. Le développement de systèmes d’aide à la décision, simulant le raisonnement médical, nécessite de modéliser cette pratique [BEC 01]. Pour cela, il importe de retracer la démarche du médecin face à un malade et de faire une analyse de la décision médicale, c’est-à-dire une étude du cheminement et des conditions du raisonnement [KAS 89].

Dans un premier temps, le médecin recueille des signes et des symptômes, en écoutant le patient et en l’examinant puis il évoque des hypothèses diagnostiques susceptibles d’expliquer les signes observés. Il tente ensuite de prévoir l’évolution de la maladie. Ces décisions (diagnostic et pronostic) relèvent de la connaissance à la différence des suivantes qui sont de l’ordre de l’action. En effet, dans un second temps, le médecin décide des investigations utiles à la validation du diagnostic. Il prescrit les examens

L’

(2)

dits complémentaires (examens de laboratoire, radiographies, endoscopies, etc.) qui lui donneront des informations permettant de confirmer ou infirmer l’une ou l’autre hypothèse. Il aura pris soin auparavant de comparer le bénéfice attendu à la somme des préjudices tels que le coût, les risques, les douleurs et le temps perdu. Ensuite, il prescrit des actes thérapeutiques susceptibles d’améliorer l’évolution de la maladie. Son attitude thérapeutique est déterminée par le diagnostic retenu, les données actuelles de la science, l’appréciation du pronostic, les souhaits du patient et parfois les règles collectives (vaccinations par exemple). Enfin, il choisit, parmi les éléments de surveillance, ceux qui apporteront la plus grande valeur informative pour la conduite du traitement et le suivi de l’évolution de la maladie.

Ainsi, la démarche du médecin se caractérise par deux types de procédures. D’une part, les procédures heuristiques ou d’investigations qui visent à découvrir une vérité objective (le raisonnement ressemble alors à celui des détectives et des chercheurs et permet de remonter des particularités sémiologiques observées chez un malade à la forme morbide générale qui explique ces particularités) et d’autre part, les procédures de décision permettant la comparaison des lignes d’action possibles et le choix de la meilleure.

Objectifs des systèmes d’aide à la décision

Les systèmes décisionnels devraient pouvoir assister de façon immédiate les médecins en leur proposant une synthèse dans leur pratique quotidienne, pourvu que celle-ci réponde réellement à leurs attentes. Malgré les nombreuses réalisations apparues depuis une vingtaine d’années, ces systèmes restent peu utilisés en routine et ce, pour plusieurs raisons. D’une part, les développeurs de ces systèmes ont souvent des ambitions de recherche en matière d’intelligence artificielle et de processus de raisonnement et appliquent de nouvelles méthodes à des connaissances médicales plutôt que d’adopter la démarche inverse qui consiste à résoudre un problème médical donné en appliquant une méthode adaptée. Bien sûr, ces recherches sont fondamentales et indispensables mais elles se font peut- être au détriment de la réalisation de systèmes réellement opérationnels et efficaces avec tout ce que cela implique en termes de développement, de documentation et de maintenance des logiciels. D’autre part, les médecins, hormis le fait qu’ils sont souvent « allergiques » à la complexité d’utilisation de l’informatique, n’imaginent pas toujours les bénéfices potentiels ou même les limites des systèmes d’aide à la décision et expriment difficilement leurs besoins de façon pertinente. Il existe des difficultés de communication entre

(3)

les développeurs (langage spécialisé informatique) et les cliniciens (langage spécialisé médical).

Le point de départ de la conception d’un système doit donc être la définition de ses objectifs en fonction de l’analyse des besoins des utilisateurs et des caractéristiques des problèmes posés.

Les objectifs d’un système dépendent des utilisateurs, de leurs fonctions et de leurs connaissances. Le degré d’aide à la décision et les fonctions attendues doivent également être définis. Il existe ainsi trois grandes catégories de systèmes :

1 – Les systèmes d’assistance documentaire représentent les systèmes d’aide indirecte à la prise de décision. Leurs objectifs sont alors de faciliter l’accès aux informations pertinentes et ce, en un temps record. L’interface utilisateur doit être particulièrement ergonomique et peut s’inspirer des techniques hypermédias par exemple. Ces systèmes documentaires n’ont pas de méthode de raisonnement à proprement parler mais ils doivent gérer des bases de données et utiliser éventuellement le multimédia et les réseaux.

Le système d’aide au diagnostic médical ADM [LEN 81] est actuellement toujours utilisé dans sa fonction documentaire. Nous pouvons également citer les systèmes de références bibliographiques tels que Medline.

2 – Les systèmes d’alerte assistent plus directement les utilisateurs en déclenchant automatiquement des alarmes signifiant des erreurs à ne pas commettre ou rappelant des informations concernant une prise de décision pour une situation donnée. Ces systèmes, comme les précédents, ne raisonnent pas véritablement mais l’aide devient plus personnalisée dans la mesure où le système tient compte des informations dont il dispose sur la situation envisagée. Ainsi le système Reconsider [NEL 85] permettant de reconsidérer un diagnostic. Les alertes peuvent être de nature différente comme la contre-indication d’une prescription médicamenteuse chez un patient, la conduite à tenir pour compléter une exploration, un protocole thérapeutique lorsqu’une pathologie est reconnue ou tout simplement fournir les valeurs normales des examens biologiques. Un exemple de système d’alerte est le système Help développé à Salt Lake City [HAU 94, PRY 83].

3 – Les systèmes consultants raisonnent sur des situations médicales définies et fournissent à l’utilisateur des conclusions argumentées selon les méthodes de raisonnement employées. Comme nous l’avons déjà suggéré, les développeurs se sont principalement intéressés à ce type de système dont la conception est intellectuellement plus satisfaisante que celles des systèmes n’utilisant pas de véritables processus de raisonnement. Effectivement, c’est dans cette catégorie que l’on note le plus de réalisations en matière de

(4)

système d’aide à la décision. Le système ADM utilise également partiellement ce mode de raisonnement. [DEN 93] Nous passerons en revue un certain nombre d’entre eux dans le chapitre traitant de la méthodologie décisionnelle.

Il reste à définir les domaines de compétence des systèmes les plus profitables pour les utilisateurs. Les praticiens ont besoin de systèmes coopératifs, qui ne reproduisent pas leur capacités naturelles mais plutôt qui les complètent.

Par contre, pour des étudiants, des systèmes d’aide au diagnostic suffisamment explicatifs, et des domaines généraux permettant de synthétiser leurs connaissances peuvent s’avérer très utiles dans le cadre de leur formation.

Méthodes

Réaliser des systèmes capables de faire ce que l’homme fait en raisonnant est une idée très ancienne bien que le terme Intelligence artificielle soit né seulement en 1956 avec les premiers systèmes informatisés. Cette discipline de l’informatique s’est véritablement développée avec l’apparition des systèmes experts dans les années 70. On peut définir le système expert comme étant un système informatique qui imite la démarche de la personne compétente dans un domaine donné, quelle que soit la méthode de raisonnement qu’elle utilise. De plus, il doit être interactif, capable de dialoguer avec ses utilisateurs et d’expliquer ses raisonnements. Bien qu’il existe toujours dans la littérature biomédicale récente, le principe du système expert paraît dépassé, les utilisateurs potentiels préférant les systèmes coopératifs aux systèmes simulant l’expert. Par la suite, ils ont laissé la place aux systèmes à base de connaissances, dont les termes sont moins restrictifs. Dans ces systèmes, les connaissances sont séparées du raisonnement mais il apparaît que la représentation des connaissances est étroitement liée à la méthode de raisonnement. Nous étudierons donc ces deux aspects en passant en revue pour chacun d’eux, les différentes techniques proposées dans les systèmes d’aide à la décision réalisés.

Nature et paramètres de la décision médicale

Les données sont souvent imprécises, ambiguës et incomplètes : un signe donné peut être présent ou absent dans une même maladie, un même signe peut être présent dans plusieurs maladies différentes. Les résultats des examens complémentaires n’ont qu’une fiabilité imparfaite. Leur interprétation et leur utilisation sont de fait incertaines : un signe qui est le

(5)

plus souvent vrai mais parfois faux, ne doit pas être rejeté, car il est fiable dans la plupart des cas. De même, l’évolution de la maladie et les résultats du traitement entrepris ne peuvent jamais être totalement certains. Tout ceci oblige le médecin à prendre ses décisions dans un climat d’incertitude et selon un raisonnement particulier. Les mécanismes de ce raisonnement peuvent être élucidés en étudiant les paramètres de la décision médicale, la mesure des incertitudes et les outils dont on dispose pour élaborer des stratégies de décision [GRE 90].

Les décisions diagnostiques, pronostiques et thérapeutiques reposent sur trois groupes d’arguments : la sémiologie qui correspond à l’étude des signes et des symptômes, la nosologie qui définit les maladies et leurs critères d’identification, et enfin les caractères de l’environnement reposant sur les données épidémiologiques, psychologiques ou socio-professionnelles.

Les signes cliniques et les résultats des examens paracliniques sont des éléments d’information permettant au médecin d’estimer l’état pathologique du patient et peuvent être rassemblés sous le terme général de tests qui sont l’expression de variables. Il existe trois types de variables :

– les variables qualitatives non ordonnées, dites nominales ou catégorielles.

Ainsi, des palpitations sont présentes ou absentes, une douleur thoracique peut être accentuée par un changement de position, une inspiration profonde ou un effort. La première information est dichotomique car elle ne peut prendre que deux valeurs tandis que la seconde est pluricatégorielle ;

– les variables qualitatives ordonnées, dites ordinales. Il existe alors une hiérarchie dans les catégories comme, par exemple, pour évaluer la sévérité d’une dyspnée qui, selon la classification de la N.Y.H.A (New York Heart Academy), peut être cotée de I à IV ;

– les variables quantitatives, dites mesurables qui s’expriment par un nombre. Elles sont continues lorsqu’elles peuvent prendre toutes les valeurs comprises dans l’intervalle des variations telles la taille, le poids ou la concentration sérique de la créatinine. Elles sont discontinues ou discrètes lorsqu’elles ne peuvent prendre que certaines valeurs, souvent des nombres entiers comme la fréquence cardiaque par minute ou le nombre de paquet- année chez un fumeur. La gestion des informations est souvent facilitée par la transformation des réponses quantitatives en réponses catégorielles où chaque classe correspond à un intervalle de mesure.

Le médecin attend donc des variables qu’elles jouent un rôle de séparateur en différenciant les sujets normaux des sujets malades, afin d’orienter sa décision. Les lignes de partage, qui définissent les différentes catégories de résultats, doivent correspondre à des frontières nosologiques.

Cependant, le choix de leur position est difficile et le pouvoir discriminant

(6)

du séparateur est souvent imparfait. Pour un test à réponse dichotomique visant à décider de la présence ou de l’absence d’une maladie M suivant une ligne de partage donnée, quatre situations sont possibles :

– le test donne une réponse positive (en faveur de M) et M est effectivement présente. Ce sont les vrais positifs (VP) qui induisent une décision correcte ;

– le test donne une réponse positive alors que M est en fait absente. Ce sont les faux positifs (FP) qui induisent une décision erronée par excès ;

– le test donne une réponse négative (en faveur de non M) et M est effectivement absente. Ce sont les vrais négatifs (VN) qui induisent une décision correcte.

– Le test donne une réponse négative alors que M est en fait présente. Ce sont les faux négatifs (FN) qui induisent une décision erronée par défaut.

On peut ainsi déterminer l’erreur de première espèce dont la probabilité est le risque alpha, pour un résultat faussement positif et l’erreur de deuxième espèce dont la probabilité est le risque bêta, pour un résultat faussement négatif. Le tableau de contingence ci-dessous résume ces situations, pour un test à réponse dichotomique :

M présente M absente

réponse du test positive

Vrai positif décision correcte

(sensibilité)

Faux positif décision erronée

(erreur α) réponse du test

négative

Faux négatif décision erronée

(erreur β)

Vrai négatif décision correcte

(spécificité)

Tableau 1. Tableau de contingence

– la sensibilité d’un test dans la maladie M est la fréquence des réponses positives au test parmi les patients atteints de la maladie M. En d’autres termes, c’est la probabilité conditionnelle d’avoir un résultat du test positif si M est présente. Le risque ß étant la probabilité d’avoir un résultat du test négatif si M est présente, on en déduit que la sensibilité est égale à 1 - ß. S’il n’existe pas de faux négatif, elle est égale à 100 %. Ainsi, la sensibilité dépend à la fois de la nosologie pour la définition de la maladie et de la sémiologie pour la définition du signe testé. En outre, elle dépend du stade évolutif de la maladie. En effet, un signe donné peut être plus souvent

(7)

présent lorsque la maladie est plus évoluée. Par exemple, la dyspnée d’effort est plus fréquente dans le rétrécissement aortique lorsque celui-ci est plus serré ;

– la spécificité d’un test dans la maladie M est la fréquence des réponses négatives au test parmi les patients qui ne sont pas atteints de la maladie M.

C’est donc la probabilité conditionnelle d’avoir un résultat du test négatif en l’absence de M. Elle correspond à 1 - α et elle est égale à 100 % s’il n’existe pas de faux positif. Elle dépend du groupe des sujets indemnes de la maladie, or ce dernier est déterminé par les circonstances d’utilisation du test et les objectifs diagnostics. Aussi, la spécificité doit être mesurée et donc utilisée lorsque les conditions d’application sont bien définies. Ceci explique qu’elle soit moins souvent mentionnée que la sensibilité d’un test dans l’étude des pathologies [BER 92].

Méthodes de raisonnement

Les systèmes existants utilisent deux grands types de stratégies de raisonnement : les heuristiques catégoriques relevant des techniques logiques et les heuristiques conjecturales qui tiennent compte des incertitudes décrites précédemment [TVE 74].

Heuristiques catégoriques

Si le médecin ne tient pas compte des incertitudes, il considère que tous les signes utiles au diagnostic sont sensibles et/ou spécifiques à 100 %, et que l’information disponible est toujours suffisante. Son raisonnement peut alors s’effectuer de façon entièrement déductive ou catégorique selon les techniques booléennes qui relèvent d’une logique binaire [SZO 78].

Au moyen de ces opérations et relations, il est possible d’établir des règles de raisonnement telles que :

– le modus ponens utilisable lorsque le signe est pathognomonique avec une sensibilité de 100 % : signe S1 observé et si S1 alors maladie M1 donc M1 présente ;

– le modus tollens utilisable lorsque le signe a une spécificité de 100 % : si M2 alors toujours S2 et signe S2 absent donc M2 absente.

Il est évident que ces situations médicales “certaines” restent exceptionnelles mais ce mode de raisonnement peut être utilisé ponctuellement et notamment dans certains systèmes experts simples ou fragments de tels systèmes. Le système Super [FON 83] a par exemple été appliqué au problème concret de la rubéole et de la grossesse. Quand le

(8)

raisonnement diagnostique tient compte des incertitudes, les heuristiques catégoriques cèdent la place aux heuristiques conjecturales.

Représentation des connaissances

Ainsi, la représentation des connaissances est partie prenante dans la réalisation de systèmes d’aide à la décision mais elle ouvre également la voie aux techniques d’acquisitions des connaissances.

Comme en témoignent la durée et la nature encyclopédique des études de médecine, la compétence du praticien est déterminée en grande partie par l’ampleur de ses connaissances médicales. De même, la compétence du système dépend de sa base de connaissances. Le raisonnement, aussi perfectionné qu’il soit, ne peut pas être appliqué directement à des connaissances complexes non structurées. Celles-ci doivent figurer le monde réel selon des formalismes établis et reconnus par les procédures de raisonnement employées. Pour une exploitation optimale de ces connaissances, les formalismes doivent exprimer de façon précise leurs caractéristiques (déterminées en fonction des objectifs du système). Cette représentation des connaissances constitue ainsi l’autre élément majeur de la modélisation des systèmes d’aide à la décision. Nous passerons en revue dans ce chapitre les différents modèles proposés pour ces systèmes, et ce, toujours en parallèle avec les techniques de raisonnement utilisées.

Règles de production

Les premiers systèmes dénommés systèmes experts (fig. 1) utilisent une représentation par règles de production. Les connaissances transmises par l’expert (grâce à l’interface expert) sont généralement stockées sous forme de règles dans la base de connaissances et donc séparées du programme qui les gère, appelé moteur d’inférence. Les règles sont indépendantes les unes des autres et peuvent donc être ajoutées ou modifiées sans répercussion sur l’ensemble du système. Les données (ou faits) concernant le patient et les problèmes posés sont mis à jour par l’utilisateur et stockés dans la base de faits (mémoire de travail). Ainsi, après interrogation de l’utilisateur, le moteur d’inférence fait travailler les règles sur les faits et choisit ses solutions. La communication établie entre l’utilisateur et le système se fait par l’intermédiaire de l’interface utilisateur.

Les règles de production utilisent la structure Si prémisses alors actions (ou déductions).

Dans Mycin [SHO 76], l’utilisateur peut connaître à tout moment les règles appliquées par la machine pour arriver à une conclusion ; il peut proposer des modifications ou des règles supplémentaires, avec cette réserve

(9)

que les règles doivent être indépendantes les unes des autres. Les chercheurs de Stanford en ont extrait le générateur Emycin, un système expert essentiel, indépendant du domaine d’application, applicable à des domaines variés.

A noter que les règles peuvent être ajoutées ou modifiées, mais cela peut être une source de conflits lorsque les règles déclenchées sont contradictoires (règles causales et règles diagnostiques).

Figure 1. Architecture d’un système expert

Réseaux sémantiques et frames

Les réseaux sémantiques sont des graphes dont les nœuds sont des entités reliées entre elles par des arcs orientés et étiquetés, signifiant des relations d’appartenance, causales, spatiales, fonctionnelles, etc.

L’organisation des données est bien adaptée à la description et permet la sélection des faits pertinents dans les mécanismes de déductions.

Les frames de Minsky [MIN 75] ou cadres sémantiques sont des réseaux sémantiques particuliers donnant une représentation structurée des données d’un objet ou d’une classe d’objets (stéréotypes définissant les propriétés générales) incluant des informations déclaratives et procédurales et permettant ainsi une souplesse de représentation. Les objets sont composés d’attributs eux-mêmes décrits par des facettes (manières d’attribuer une valeur à l’attribut, tâches à réaliser...) et pouvant faire référence à d’autres cadres sémantiques. L’ensemble des cadres sémantiques est organisé hiérarchiquement par des liens de généralisation/spécialisation et de concepts/instances. Il existe une similitude des concepts utilisés par les cadres sémantiques et les modèles sémantiques des SGBD. Mais à la différence de ces derniers, les cadres sémantiques sont utilisés en mémoire centrale et accordent la priorité à la dynamicité et à la souplesse des constructions sur la structuration des données.

(10)

Pour le système ADM, une représentation des signes sous forme d’objets structurés et de classes a été modélisée [RIO 91] (fig. 2).

Figure 2. Modèle de représentation des signes de l’ADM

Iliad [BOU 92, WAR 89] utilise aussi ce type de représentation pour résoudre le problème des dépendances entre signes en introduisant des profils intermédiaires sous forme de regroupements appelés clusters [74, 76].

Les cadres sémantiques ont également été adoptées pour Internist-1 [MIL 92]

et Dxplain [BAR 87].

Heuristiques conjecturales

Toutes les techniques de diagnostic automatique simulant le raisonnement médical sous incertitude relèvent de la reconnaissance de forme ou de la classification. Elles consistent en une procédure de discrimination permettant de ranger tous les tableaux sémiologiques possibles dans un certain nombre de classes (maladies), chaque classe étant définie comme un ensemble de signes élusifs ou inconstants. Le résultat s’exprime en termes de degré de certitude d’une conclusion à partir de

(11)

certaines prémisses (système expert du type Mycin), de probabilité des diagnostics à partir de l’information disponible (probabilités bayesiennes), de « distance » du patient aux divers types pathologiques (analyse discriminante) ou de degré d’appartenance à divers sous-ensembles sémiologiques (logiques floues).

Le système Mycin [SHO 76] reste le système expert de référence (bien qu’il n’ait jamais été utilisé en routine). Il est destiné à conseiller le médecin sur le choix d’un antibiotique adapté au traitement d’un patient porteur d’une infection bactérienne, avant que le germe ait été identifié avec certitude. Ce système raisonne par règles conditionnelles (si S alors M) affectées d’un coefficient de certitude qui reflète le degré de confiance du médecin expert dans ses connaissances. L’utilisateur peut représenter sa propre incertitude au sujet des signes présentés par le patient et cette incertitude des faits va se combiner à celle des règles pour mesurer l’incertitude de la conclusion. Ce système utilise une stratégie apparentée aux méthodes de logique floue, pour fixer la façon dont les facteurs de certitudes se combinent dans une chaîne de raisonnements.

Internist-1, qui est issu de Dialog [POP 75] et donnera le système QMR (Quick Medical Reference) d’aide au diagnostic en médecine interne, est également un pionnier des systèmes experts médicaux [MID 92, MIL 86].

Selon une approche hypothético-déductive, le système établit des scores mesurant le degré d’association d’un signe avec une maladie par l’intermédiaire de trois relations : « Manifest » avec la fréquence d’apparition du signe lorsque la maladie existe, « Evoque » avec la fréquence de la maladie lorsque le signe est présent et « Form-of » qui établit que la manifestation est une forme de la maladie. Les diagnostics sont ordonnés par scores décroissants et les meilleurs sont retenus.

Méthodes probabilistes et statistiques Théorie bayesienne

Le choix d’un diagnostic peut se faire en évaluant les probabilités de la présence de chaque maladie en fonction des résultats du test utilisé. Ces probabilités conditionnelles sont appelées valeurs prédictives ou probabilités post-test et elles tiennent compte d’une part de la prévalence de la maladie envisagée, et d’autre part des qualités nosologiques du test [GUR 00]. La valeur prédictive positive (VPP) d’un test en faveur d’une maladie est la probabilité de la présence de cette maladie si la réponse du test est positive. La valeur prédictive négative (VPN) est la probabilité de l’absence de la maladie si la réponse du test est négative. Leur estimation s’effectue à partir du théorème de Bayes, théorème élémentaire de la théorie

(12)

des probabilités. La probabilité d’une maladie M sachant que la réponse au test est R se formule ainsi :

p(M/R) = p(M et R) p(R)

– p(M/R) = lire probabilité de M si R

– p(M et R), qui est la probabilité de la présence simultanée de la maladie M et de la réponse R au test, peut s’écrire : p(M et R) = p(M) . p(R/M)

p(R), qui est la probabilité de la réponse R.

Les probabilités ainsi obtenues permettent d’intégrer au raisonnement médical les résultats de la recherche clinique et épidémiologique sur la fréquence des pathologies, la fréquence des signes dans les maladies, le rendement des tests diagnostiques ou l’efficacité des protocoles thérapeutiques. Parmi les premiers systèmes probabilistes, on peut citer celui de de Dombal qui, dans la fin des années 60, aidait au diagnostic des syndromes douloureux abdominaux avec huit maladies et 50 signes. Des évaluations ont montré qu’il était performant à Leeds, lieu de sa conception [DOM 72] mais son adaptation à d’autres pays nécessitait un reparamétrage spécifique de sa base de données.

Théorie de la décision

Cette théorie a donné naissance aux systèmes experts « normatifs » [COO 93]. S’inspirant des connaissances en psychologie et de l’analyse de la décision, elle ajoute aux règles probabilistes des notions d’utilité ou de préférence pouvant améliorer les performances de la stratégie décisionnelle.

L’utilité reflète la préférence du patient en tenant compte de l’espérance de vie du patient, des traumatismes psychologiques engendrés pour le patient et son entourage, du coût financier du traitement et des conséquences sociales. De plus, un diagnostic peut être privilégié en raison de sa gravité en l’absence de traitement même si un autre diagnostic paraît plus probable.

Par exemple, une angine de l’enfant doit être traitée comme une angine à streptocoques en raison de sa gravité en l’absence de traitement. Pour cela, l’utilité (ou le coût) des conséquences prévisibles est estimée et l’espérance mathématique de chaque conduite est calculée. La règle bayesienne de décision prescrit de choisir la conduite ayant la plus grande espérance.

Pathfinder est un exemple de système normatif qui assiste le chirurgien dans les diagnostics d’adénopathies peropératoire [HEC 92a, 92b]. La notion d’utilité peut également être exploitée pour étudier les bénéfices et les coûts

(13)

d’une information supplémentaire et donc rechercher les meilleures stratégies. Les systèmes normatifs, à la différence des systèmes descriptifs devraient permettre de rectifier ces défauts comme par exemple l’oubli des antécédents d’un patient. Une étude comparée du système Pathfinder avec une de ses versions plus ancienne strictement bayesienne a montré une amélioration significative de l’efficacité des décisions. Il apparaît que ces méthodes procurent un moyen explicite pour interpréter les données et permettent à l’utilisateur d’apprendre à choisir les bons tests pour confirmer ou infirmer un diagnostic.

Les algorithmes déterministes ont été combinés à cette théorie dans d’autres modèles tels que Munin [SUO 01], alliant ainsi la facilité d’emploi du premier et la flexibilité et l’efficacité du second.

Théorie de l’information

La théorie de l’information consiste à estimer numériquement l’information acquise par l’intermédiaire de l’entropie de Shannon [SHA 49]

d’une loi de probabilité qui est l’espérance mathématique de la fonction d’information de cette loi. Le principe du maximum d’entropie vise à modéliser l’incertitude pesant sur les valeurs d’une variable, au moyen d’une loi de probabilité d’entropie maximum parmi toutes les lois de probabilité sur les valeurs de la variable vérifiant les contraintes définies par l’information a priori dont on dispose sur la variable.

Le système d’aide au diagnostic médical Iliad[BOU 92] utilise des méthodes de raisonnement bayesiennes et booléennes sur les liens entre les manifestations et les maladies. L’équipe de Salt Lake City a conçu et évalué plusieurs algorithmes dérivés de la théorie de l’information. L’un d’eux, le modèle de Shannon, mesure l’entropie maximum pour évaluer le contenu de l’information. Il s’est avéré être plus efficace que l’algorithme actuel dérivé de la théorie de la décision. Le système expert Meninge élaboré au CHU de Grenoble [ROB 91] est un système d’aide au diagnostic précoce des méningites infantiles qui exploite également cette théorie : il construit des variables appelés « score LCR » et « score biologique » au moyen d’analyses factorielles discriminantes et résume les données cliniques et épidémiologiques par une variable « score clinique ». Il utilise ensuite le principe de maximum d’entropie pour évaluer les variables logiques qui entreront dans les règles de décision diagnostique et permettront de décider des étiologies bactériennes, virales ou indéterminées.

Méthodes de logique floue

Le but de ces méthodes est de simuler la logique humaine par un mode de raisonnement inexact, présumé être le raisonnement humain habituel et

(14)

donnant pourtant des résultats corrects. Selon la théorie des ensembles flous de Zadeh [ZAD 65], une fonction caractéristique assigne à un élément x un degré d’appartenance à l’ensemble E. Cela permet de représenter les symptômes en tenant compte de la transition du normal à l’anormal. Une maladie est l’union d’un certain nombre de symptômes (flous). La procédure diagnostique consiste à trouver à quel degré l’ensemble des symptômes du patient est en intersection avec telle ou telle maladie.

La théorie de l’évidence de Dempster-Schafer [DEM 77, SCH 76] utilise des notions de crédibilité et plausibilité qui correspondent aux bornes inférieure et supérieure d’une probabilité mal connue. La théorie des possibilités [PRA 89] caractérise l’incertitude par deux valeurs : le degré de possibilité et le degré de nécessité qui correspondent aux probabilité inférieure et probabilité supérieure de l’événement. AntibES qui aide à la prescription d’antibiotiques [PAL 91] est un exemple de logiciel basé sur la logique possibiliste.

Raisonnement temporel

La prise en compte de la dimension temporelle est également nécessaire car certaines maladies ne peuvent pas être qualifiées de présentes ou absentes. Chaque stade peut donner des manifestations différentes et nécessite une étude de sa sévérité et son évolutivité [BER 89]. D’une manière générale, l’ensemble des problèmes de prédiction et de planification nécessitent de modéliser et de représenter le temps dans les systèmes à base de connaissances. Du point de vue formel, des travaux ont été réalisés sur les logiques temporelles. Le modèle le plus connu est celui de la représentation par intervalles [AL 83]. Il a nécessité la réalisation d’un gestionnaire d’intervalles et l’extension de l’algorithme de propagation aux relations de durée. Cela permet la définition de règles expertes utilisant des références temporelles.

Des générateurs de systèmes experts peuvent donc être définis pour le diagnostic prédictif. L’architecture générale d’un tel système peut être présentée sous forme de cinq modules : saisie des informations, prédiction d’évolution des paramètres, gestion de la base de connaissances, module de diagnostic et module de planification. Les différents concepts temporels peuvent être représentés sous forme de phénomènes ponctuels ou non ponctuels ou encore non datés. L’ensemble des prémisses de la partie gauche des règles contiennent des prédicats et des conditions de type contraintes temporelles. La partie droite des règles contient les actions liées au déclenchement des règles : ajout d’un fait ou action, déclaration de fin d’occurrence ou d’attente d’événements. Cette représentation est bien adaptée aux exemples de contrôle de processus ou de planification.

(15)

Le modèle du tableau noir

L’architecture de tableau noir (Blackboard), est un modèle général de résolution de problèmes permettant de faire coopérer des modules (ou agents) ‘spécialistes’ détenteurs de connaissances particulières et homogènes. Ainsi, ce modèle est un système multi-agents au même titre que les systèmes d’acteurs et les systèmes physiquement distribués que nous n’envisagerons pas ici. Les modules sont également nommés sources de connaissances. Ils sont indépendants entre eux et ne reçoivent directement aucune information des autres modules. Néanmoins, ils peuvent avoir besoin d’informations produites par d’autres modules pour mener à bien leurs tâches. Aussi, ils partagent le même espace de recherche qui est le tableau proprement dit où sont réunis les objets manipulés en entrée ou en sortie par les modules. Il constitue ainsi une mémoire de travail. Les modules reconnaissent les objets du tableau qui les concernent et ignorent les autres. Ils sont de la forme condition/action : ils détectent les configurations des objets dans leur partie condition et les actions sont des créations, des suppressions ou des modifications d’objets du tableau.

Ces modèles de tableau noir sont nés de travaux portant sur la compréhension automatique de la parole au début des années 80, puis ils ont été utilisés dans des domaines variés tels que l’interprétation des signaux, la compréhension d’images, la planification ou la médecine. Cette approche multi-agents paraît tout à fait adaptée à la résolution des problèmes médicaux car ils sont souvent de nature distribuée. En effet, leurs résolutions nécessitent l’intervention de divers spécialistes, ceux-ci pouvant être localisés en différents endroits.

Ces systèmes sont soumis à des contrôles visant à maintenir une solution globale cohérente tout en coordonnant et planifiant les activités des différents agents.

La mise en œuvre des systèmes à architecture de tableau noir reste complexe du fait des difficultés rencontrées lors de l’implémentation de leurs stratégies de contrôle. De plus, ces stratégies doivent être adaptées à la nature des problèmes à résoudre. Un contrôle hybride, synthétisant les différents contrôles cités précédemment, pourrait permettre de construire des systèmes plus généraux, capables de résoudre plusieurs types de problèmes.

Ce type d’approche a tout de même permis de réaliser des applications médicales notamment : le système Cardiolab [SIR 96] est également un système implémenté selon l’architecture du tableau noir. Il utilise un modèle qualitatif profond de l’activité électrique du cœur, basé sur l’anatomie et la physiologie. Ce simulateur hémodynamique et électrocardiographique

(16)

constitue un outil d’enseignement et de recherche. Un module d’aide au diagnostic est en cours d’intégration.

Représentation objet

La représentation objet a donné lieu à des applications médicales dans le domaine de l’intelligence artificielle [HEA 91]. Un système d’aide à la prescription d’antibiotiques a été conçu en associant des règles de production et une programmation orientée objet efficace par ses propriétés telles que l’héritage mais aussi par ses possibilités de structuration dynamique [THEL 90]. Les avantages de cette représentation paraissent plus liés aux techniques d’implémentation qu’aux possibilités de raisonnement sous incertitude ainsi qu’en témoigne l’utilisation d’opérations orientées objet dans le réseau probabiliste du système Painulim [XIA 93].

Modèles profonds et réseaux causaux

Une autre approche, inaugurée par les réseaux causaux [KUL 82], est de prendre en compte des modèles physiopathologiques dits profonds (au niveau cellulaire, organique ou systémique) pour expliquer des phénomènes superficiels observables par la clinique ou les moyens d’investigation paraclinique. Le raisonnement causal construit un modèle physiologique et compare la cohérence et la complétude des données du patient avec le modèle défini. Il se traduit par des liens de cause à effet entre deux variables ou liste de variables. Le modèle causal décrit des mécanismes anatomiques, physiologiques ou biochimiques, il sert à simuler les fonctions normales du corps, ses dysfonctionnements occasionnés par une ou plusieurs pathologies dont les conclusions se recouvrent ou interagissent. La connaissance physiopathologique est organisée hiérarchiquement (information de plus en plus détaillée). Un modèle est créé pour chaque patient. Toutes les informations sur le patient sont utilisées pour générer des séries différentes d’événements qui sont appelés scénarios, et qui conduiront à définir l’image clinique en cours. Les dysfonctionnements physiologiques sont des états représentés sous forme de nœuds. Les relations causales qui les unissent sont représentées par des liens entre deux nœuds. Chaque lien est associé à une valeur qui témoigne de la fréquence avec laquelle le deuxième nœud est causé par le premier.

Parmi les systèmes utilisant ce type de représentation, on peut citer Casnet [KUL 82] qui est un système d’aide au diagnostic et à la thérapeutique du glaucome ou Abel [PAT 82, SZO 78] traitant des troubles hydroélectriques.

(17)

Cette approche se veut plus rationnelle et scientifique : Elle est utile pour aider à la compréhension de certaines pathologies liées à des perturbations de phénomènes biochimiques, biophysiques ou de régulation homéostasique.

Elle permet de prendre en compte, chaque fois que cela est possible les connaissances dynamiques des systèmes biologiques qui vont de la cellule aux organes et systèmes physiologiques et représente un moyen évident de formalisation des dépendances entre les manifestations pathologiques.

Cette approche reste cependant limitée lorsqu’il s’agit de pathologies complexes ou inexpliquées. Elle est inopérante pour des pathologies multiples, des maladies de système ou lorsqu’une composante psychique est présente.

Réseaux probabilistes

Les réseaux probabilistes [BUR 00, GOL 92] visent à modéliser les événements du monde réel (les maladies et les relations entre elles) et à affecter des probabilités aux conséquences de ces événements (les manifestations pathologiques). Chaque nœud du graphe est une variable aléatoire (une maladie, un syndrome ou un signe). Un nœud a plusieurs états possibles et quelle que soit la situation décrite, il est toujours exactement dans un de ces états.

Les graphes orientés, également nommés réseaux de croyance [JEN 90, HER 92, COU 93], réseaux bayesiens [GAM 92], réseaux causaux probabilistes [AND 89, 91] ou réseaux de causalité [PEA 88a, 88b] signifient les influences de nature causale (leur sémantique reste néanmoins pauvre) et correspondent à des densités conditionnelles. Les graphes non orientés nommés modèles graphiques correspondent à des relations statistiques d’association ou potentiels [LAU 89, 91].

L’incertitude est formalisée d’une part dans la probabilité d’un état d’un nœud qui dépend de l’information disponible, et d’autre part dans les relations entre nœuds par les probabilités conditionnelles, présentant elles- mêmes une part d’incertitude dans leurs estimations statistiques ou subjectives. Des méthodes de calcul de la confiance que l’on peut avoir dans les résultats des réseaux probabilistes sont à l’étude. Il s’agit de structurer le domaine de connaissances a priori puis ensuite les informations concernant un patient sont propagées à travers le réseau, les probabilités d’un nœud dépendant directement de son voisinage.

Ce mode de représentation permet de raisonner à travers une structure conceptuelle uniforme et attractive mais les calculs du raisonnement peuvent être lourds, du fait de l’explosion combinatoire et leur réalisation en temps réel est une préoccupation majeure. De plus, les réseaux présentant

(18)

des cycles sont des structures complexes à gérer et peuvent conduire à des résultats contre-intuitifs. Aussi, plusieurs algorithmes ont été proposés selon deux types de méthodes : les premières qui sont exactes et reposent sur le conditionnement et le regroupement ont été utilisées dans des systèmes tels que Pathfinder qui assiste le chirurgien dans les diagnostics d’adénopathies peropératoire, Munin ou Painulim [XIA 93] traitant des diagnostics neuromusculaires. Les secondes sont aléatoires, utilisant des techniques de simulation stochastique. Ces dernières méthodes paraissent plus adaptées aux grands réseaux probabilistes comme en témoigne QMR-DT qui est une reformulation de QMR en réseau probabiliste et l’un des rares modèles à couvrir un large domaine médical. Néanmoins, plusieurs approximations intéressantes ont été envisagées dans les méthodes exactes en exploitant les propriétés locales des réseaux et en identifiant des sous-domaines.

Ce type de représentation est en adéquation avec les données de la littérature où la représentation est causale (« L’infarctus du myocarde donne fréquemment une douleur thoracique ») et l’acquisition des connaissances s’en trouve ainsi facilitée. De plus, il est possible d’introduire les niveaux de raisonnement ou les hypothèses intermédiaires qui permettent un raisonnement plus explicite bien que les algorithmes d’inférences ne le soient pas toujours et il devient possible de vérifier la cohérence d’un diagnostic.

Les connaissances sont stables et représentées de façon uniforme, indépendamment des tâches du système. Les corrections effectuées sur certaines variables n’affectent pas la cohérence globale du modèle.

Ainsi, les réseaux probabilistes présentent de nombreux intérêts expliquant la reconversion de QMR et les combinaisons de ceux-ci à d’autres modes de représentation des connaissances et d’inférences. Néanmoins, un certain nombre de problèmes persistent tels que la complexité des algorithmes d’inférences et de l’apprentissage, les calculs ou les besoins informatiques lorsque le modèle est élargi. C’est probablement pour cette raison que la représentation de la connaissance de QMR-DT a été largement simplifiée par rapport au modèle initial [SHW 91]. En effet, les connaissances physiopathologiques ont été abandonnées et seul un système à deux niveaux a été gardé : d’une part, le niveau des maladies, qui représentent les racines du graphe et qui ne sont pas reliées entre elles et d’autre part, les manifestations, également non reliées entre elles.

(19)

Figure 3. Modèle de QMR-DT : graphe acyclique direct

De plus, plusieurs hypothèses simplificatrices ont été formulées comme par exemple :

– indépendance marginale des maladies ;

– maladies et manifestations considérées comme des variables binaires ; – les signes sont toujours pris comme des manifestations de maladies ; – etc.

Un modèle de réseau probabiliste a été proposé pour la base de connaissances ADM [CLE 01] en utilisant la méthode d’inférence exacte de Lauritzen et Spiegelhalter [LAU 88]. La structure de l’ADM paraît adaptée à ce type de représentation causale des connaissances mais une étude de l’estimation des probabilités reste à envisager et l’optimisation de la méthode d’inférence paraît indispensable.

Modèles connexionnistes et réseaux de neurones formels

L’historique et les principes des modèles connexionnistes ont été décrits récemment par Grumbach en parallèle avec les processus cognitifs humains.

L’approche connexionniste remonte aux années 40 avec les travaux de Mc Culloch et Pitts qui portaient sur un modèle de réseau de neurones formels. Cette approche vise à imiter certaines fonctions du cerveau humain en reproduisant quelques-unes de ses structures de base. Elle est fondée sur le comportement de réseaux de neurones formels élémentaires interconnectés, chaque neurone formel pouvant être considéré comme une simplification extrême d’un neurone. Le modèle du perceptron de Rosenblatt est l’une des premières réalisations dans ce domaine. Depuis le début des années 80, on assiste à une renaissance de l’approche connexionniste et ce, pour plusieurs raisons : d’une part, le développement

(20)

des technologies d’investigations (scanner, résonance magnétique nucléaire...) offrent de nouveaux horizons pour la compréhension des phénomènes neuronaux, et d’autre part, plusieurs études portant sur les possibilités d’extension des réseaux de neurones monocouche ont été réalisées et de nouveaux modèles sont apparus.

Le neurone formel peut être défini par les cinq éléments suivants : la nature de ses entrées, la fonction d’entrée totale (prétraitement effectué sur les entrées), la fonction d’activation ou d’état du neurone (état interne en fonction de son entrée totale), la fonction de sortie du neurone (en fonction de son état interne) et la nature de la sortie du neurone.

Des poids wij sont associées aux connexions et pondèrent les signaux transmis. L’activité de l’unité j est donnée par la formule aij =

ΣΣ

wij entréei et sa sortie par sortiej = f(aj).

Les réseaux de neurones jouent un rôle de plus en plus important dans le domaine de l’aide à la décision médicale par les possibilités d’apprentissage qu’ils offrent. Sabbatini passe en revue un certain nombre d’entre eux. On peut également citer des systèmes récents [CUN 00] et en cardiologie, une application aidant au diagnostic des épilepsies [WAL 01].

Discussion

Les systèmes documentaires et d’alerte, souvent oubliés, apparaissent pourtant tout aussi utiles et sont souvent les plus performants en matière d’informatique. De plus, ils pourraient peut-être familiariser en douceur les utilisateurs potentiels avec les techniques informatiques tout en leur laissant l’entière maîtrise de la décision.

Les méthodes probabilistes présentent des intérêts mais elles ont des limites liées notamment aux conditions qu’impose l’application du théorème de Bayes. Nous avons vu dans le chapitre traitant de la représentation des connaissances que les réseaux probabilistes donnent la possibilité de résoudre certains problèmes engendrés par ces contraintes.

Dans l’ensemble, il semblerait que les maladies courantes soient bien reconnues par les méthodes probabilistes ou statistiques, alors que les maladies rares sont mieux détectées par les systèmes qui simulent le raisonnement. L’idéal serait d’utiliser simultanément plusieurs méthodes et de corriger les résultats des unes par les autres.

(21)

Transparence

Elles permettent de donner des explications simples et compréhensibles par tous, bien qu’elles soient parfois critiquées. En effet, certains auteurs notent qu’un médecin raisonne le plus souvent sur des relations de cause à effet plutôt que sur des probabilités de diagnostics. Effectivement, les systèmes bayesiens traditionnels ne peuvent pas expliquer les processus physiopathologiques mis en jeu. Comparé à l’expert qui est capable d’expliquer l’ensemble de ses raisonnements, ces systèmes sont aussi moins performants quand il existe des séries d’ajustements dans les calculs des probabilités a posteriori comme dans Iliad [BOU 98]. Sumner souligne également l’utilité pour les étudiants, de disposer d’informations sur le pouvoir discriminateur des signes mais ceci est rarement le cas dans les systèmes actuels.

Raisonnement causal et raisonnement diagnostique

Le raisonnement causal détermine les signes attendus en présence d’une maladie. En termes de probabilité, cela s’exprime par P(signe/maladie présente). Le raisonnement diagnostique consiste à rechercher les maladies lorsque des signes sont observés. Les méthodes probabilistes déterminent P(maladie/signe observé). Dans certains systèmes, l’utilisation de ces deux types de raisonnement peut être source de conflits. Par exemple, un ensemble de règles diagnostiques peut être en contradiction avec un ensemble de règles causales s’ils sont déterminés séparément. Dans les méthodes bayesiennes, le théorème de Bayes assure la correspondance entre les deux types de raisonnement :

P(maladie/signe) = P(signe/maladie) * P(maladie) P(signe)

Cette impossibilité à spécifier indépendamment les deux raisonnements semble correspondre manifestement à la réalité. Leur distinction reste néanmoins nécessaire pour permettre un raisonnement non monotone, c’est- à-dire un raisonnement où l’on peut remettre en cause un résultat en fonction de nouvelles données.

Indépendance des signes

L’indépendance des signes n’est pas toujours vérifiée, notamment lorsque plusieurs signes résultent du même processus physiopathologique.

Ceci nécessite d’envisager des méthodes tenant compte de cette contrainte pour éviter de considérer plusieurs fois les mêmes éléments et de surestimer les probabilités. Ainsi, par exemple, le système d’aide au diagnostic des

(22)

pathologies en rhumatologie de l’institut Jan van Breemen d’Amsterdam utilise une matrice signifiant la force des associations entre les signes.

Objectivité et subjectivité des données

Les méthodes probabilistes permettent le contrôle du raisonnement par l’objectivité des faits et évitent ainsi des erreurs et des dérives importants.

Mais les fréquences réelles des maladies ou des signes ne sont pas toujours connues. Les médecins experts font alors des estimations subjectives qui peuvent biaiser les interprétations et donner des résultats moins performants. Des exemples de ces dérives sont la surestimation de l’évaluation d’événements conjoints, la sous-estimation d’événements disjoints... Certains concepteurs préfèrent néanmoins récolter les degrés de croyance des experts, modifiables par les données expérimentales, car procéder à des études statistiques pour toutes les données manquantes serait trop coûteux. De même, la théorie de la décision avec ses notions d’utilité représentent intrinsèquement une source de données subjectives.

Pour les probabilistes objectivistes, la probabilité mathématique ne peut modéliser l’incertitude que lorsque celle-ci est liée à une expérience reproductible. Ceci conduit à envisager des méthodes de raisonnement basées sur des principes statistiques. Le système Thomas [LEH 92] abonde dans ce sens en appliquant objectivement la méthode bayesienne : Les probabilités post-test sont calculées à partir du modèle statistique intégré au système, aidant ainsi les médecins dans l’interprétation des résultats statistiques.

Dans les méthodes de régression multiple et d’analyse discriminante, le diagnostic est traité comme une variable aléatoire à expliquer et un certain nombre de tests correspondent aux variables explicatives indépendantes. Un échantillon d’apprentissage est constitué de malades connus, porteurs d’une des affections à évaluer et dont on connaît les valeurs des tests. Si la variable à expliquer est qualitative, on calcule une fonction linéaire discriminante qui vise à séparer les deux nuages de points et maximise la distance entre les deux maladies testées pour minimiser les erreurs de classification. La validité de cette fonction discriminante sera testée sur un second échantillon et si c’est le cas, elle sera appliquée à de nouveaux patients. Si la variable à expliquer est quantitative (durée de survie par exemple), on procède de la même manière en construisant une fonction de régression. Ainsi, ces méthodes utilisées par exemple dans le système Meninge [ROB 91], permettent de sélectionner progressivement les variables réellement explicatives.

(23)

Discrétisation des données

Dans les méthodes purement bayesiennes, les tests donnant des valeurs continues doivent être discrétisés, impliquant ainsi une perte d’information.

L’analyse discriminante permet d’éviter cette perte d’information que représente la transformation des variables continues en variables discrètes et évite ainsi de créer des incertitudes supplémentaires. Certains auteurs estiment au contraire, qu’une discrétisation des variables permet de se rapprocher du raisonnement de l’expert mais elle pose le problème de l’interprétation des valeurs frontières et nécessite d’intégrer des graphes de distribution des fréquences.

Données nécessaires et suffisantes

Les connaissances du système de de Dombal envisagé précédemment ont été utilisées pour concevoir un système bayesien strict (Proper Bayes) respectant totalement le théorème de Bayes en faisant des séries de tests de chi-2 sur les données. Lors de l’évaluation, les pourcentages des diagnostics corrects étaient : médecins = 76 %, système de de Dombal = 74 %, système Proper Bayes = 65 %. Malgré la disparition du défaut qui existait dans les systèmes Bayesiens simples du fait de l’hypothèse d’indépendance des informations, les résultats sont moins bons. Les auteurs pensent que cela s’explique par l’absence d’une base de données suffisamment grande pour identifier toutes les combinaisons de symptômes utiles. Dans des systèmes tels que Meninge, les méthodes employées appauvrissent la réalité médicale en utilisant peu les connaissances. En effet, elles reposent uniquement sur les diagnostics dans l’échantillon d’apprentissage et les signes supposés discriminateurs. Dans les approches statistiques en général, il faudrait évaluer un grand nombre de diagnostics. Ceci impose un coût considérable en temps et en moyens, pose le problème de l’évaluation des maladies rares et reste sujet à des dérives liées aux conditions de recueil des données. Par exemple, à l’hôpital la grippe sera répertoriée seulement chez des patients ayant une maladie intercurrente.

A la différence des experts, les systèmes actuels ne reconnaissent pas leurs limites. Aussi, Sumner suggère d’intégrer par exemple des profils d’alerte capables d’informer par des moyens simples que le cas envisagé s’éloigne du domaine reconnu.

Les méthodes probabilistes supposent l’exhaustivité des hypothèses diagnostiques. La somme des probabilités des hypothèses diagnostiques doit être de 1. Mais on ne peut jamais être certain d’avoir envisagé tous les diagnostics possibles. Pour y remédier, on peut envisager d’ajouter une catégorie « autres » ayant une probabilité prétest faible car elle ne sera pas

(24)

utilisable du fait de son hétérogénéité, mais cela risque de diminuer les performances du système.

Exclusivité des diagnostics – Cas multidiagnostics

Une contrainte des méthodes probabilistes est l’exclusivité mutuelle des maladies : ceci nécessite un ensemble de diagnostics tel que tout malade en ait un et un seul. Une telle hypothèse est justifiée dans le cas de deux maladies aiguës considérées comme ponctuelles mais elle ne reflète pas toujours la réalité surtout dans certaines disciplines telles que la médecine interne ou la rhumatologie où les maladies chroniques sont fréquentes. De plus, la conjonction de deux maladies peut modifier l’attitude du médecin.

Une solution peut être de définir les combinaisons de plusieurs pathologies comme des diagnostics distincts. L’équipe d’Amsterdam résout ce problème en considérant qu’une manifestation peut résulter de plusieurs maladies et en proposant une liste finale de diagnostics. Il semblerait qu’une telle stratégie donne de meilleurs résultats. Une méthode utilisant les fréquences des épisodes pathologiques plutôt que les fréquences des maladies elles- mêmes a également été proposée.

Lourdeur des calculs

Il existe une explosion combinatoire lorsque le nombre de données augmentent, les calculs du raisonnement peuvent alors être lourds et leur réalisation en temps réel est une préoccupation majeure. Plusieurs algorithmes ont été proposés pour améliorer leur fiabilité et leur rapidité comme nous le verrons à propos des réseaux probabilistes.

Transférabilité et évolutivité des connaissances

De Dombal, dans la fin des années 60, concevait un système d’aide au diagnostic des syndromes douloureux abdominaux dont des évaluations ont montré qu’il était performant à Leeds, lieu de sa conception et médiocre à Paris et Copenhague (modification de la prévalence des pathologies). Il récupérait son niveau de performance après intégration des données locales et modification des fréquences des divers diagnostics. Seule était transposable d’un lieu à un autre la méthode générale de raisonnement (bayesienne), qui tient en une équation. La base de données qui fait l’efficacité diagnostique de cette méthode, est au mieux une base de données locales, constamment remise à jour.

Les facteurs influençant la transférabilité des systèmes médicaux ont été répertoriés et il apparaît qu’un système probabiliste est moins transférable qu’une base de règles par exemple, du fait de son manque de flexibilité et des limites strictes de son domaine de connaissances. Ce problème a

(25)

également été étudié lors de l’implémentation de versions allemande et française du système Iliad [BOU 92].

Conclusion

Les méthodes relevant de l’intelligence artificielle [WES 00], y compris les systèmes experts sur des domaines médicaux restreints [SUM 92, VOL 00], continuent d’être utilisées notamment en bio-informatique [SEL 01].

Cependant, les systèmes évoluent vers des systèmes à bases de connaissances [HAN 01, MOL 00]. Comme nous l’avons vu, les larges bases de connaissances développées dans les années 80 ont évolué vers des versions web sur internet telles que ADM [SEK 97] Dxplain [BAR 98], ou ont été reconverties vers des systèmes à l’usage des patients tels que QMR [SHA 00] et Iliad [BOU 98]. Il faut noter que les méthodes probabilistes sont très utilisées et qu’il existe une reformulation de ADM en réseau Bayesien [CLE 01] ou de QMR en système probabiliste appelé QMR-DT [SHW 91].

Ces méthodes formalisent de façon plus rigoureuse le raisonnement médical et, de fait, paraissent à certains trop rigides et réductrices de la réalité. Ceci a conduit à envisager des méthodes plus souples comme les méthodes dites de logique floue. Par ailleurs des systèmes à base de réseaux de neurones formels continuent à se développer [ZHA 98].

Références

[ALL 83] ALLEN J.F., "Maintaining knowledge about temporal intervals", ACM 26, 1983, p. 510-521.

[AND 89] ANDREASSEN S., "Decisions Based on Qualitative and Quantitative Reasoning." Lecture Notes in Medical Informatics. "Knowledge Based Systems in Medicine : Methods, Applications and Evaluation", Talmon Fox (Eds). Springer-Verlag, 1989, p. 68-79.

[AND 91] ANDREASSEN S., JENSEN F.V., OLESEN K.G., "Medical expert systems based on causal probabilistic networks", Int.Journal Biomed.Comput., Vol. 28, 1991, p. 1-30.

[BAR 87] BARNETT G.O., CIMINO J.J., HUPP J.A., HOFFER E.P., "DXPLAIN: Anevolving diagnostic decision-support system", JAMA, Vol. 258, n° 1, 1987.

[BAR 98] BARNETT G.O., FAMIGLIETTI K.T., KIM R.J., HOFFER E.P., FELDMAN M.J.,

"DXplain on the Internet", Proc. AMIA Symp., p. 607-611, 1998.

[BEC 01] BECK J.R., "Medical Decision Making : 20 years of advancing the field", Medical Decision Making, Vol. 21, n° 1, 2001, p. 73-75.

[BER 91] BERGERON B., "ILIAD : A diagnostic consultant and patient simulator", MD Computing, Vol. 8, n° 1, 1991, p. 47-53.

(26)

[BER 92] BERNELOT MOENS H.J., HIRSCHBERG A.J., CLAESSENS A.A., "Data-source Effects on the Sensitivies and Specificities of Clinical Features in the Diagnosis of Rheumatoid Arthritis : The relevance of Multiple Sources of Knowledge for a Decision-support System", Medical Decision Making, Vol. 12, 1992, p. 250-258.

[BER 89] BERZUINI C., QUAGLINI S., BELLAZZI R., "Belief Networks Representations of Temporal Knowledge for Medical Expert Systems". Lecture Notes in Medical Informatics. "Knowledge Based Systems in Medicine : Methods, Applications and Evaluation", Talmon, Fox (Eds). Springer-Verlag, 1989, p. 49-67.

[BOU 92] BOUHADDOU O., LEPAGE E., HUBER P., "Challenges in disse-minating a bayesian expert system : the French and German versions of Iliad", MEDINFO 92, Vol. 1, 1992, p. 427-433.

[BOU 98] BOUHADDOU O., LAMBERT J.G., MILLER S., "Consumer health informatics : knowledge engineering and evaluation studies of medical HouseCall", Proc AMIA Symp., 1998, p. 612-616.

[BUR 00] BURNSIDE E., RUBIN D., SHACHTER R., "A Bayesian network for mammography", Proc. AMIA Symp., 2000; p. 106-110.

[CLE 01] CLERET M., LE DUFF F., FRESNEL A., LE BEUX P., "DIAMED : A Probabilistic Diagnostic Aid System on the Web Proceedings", MEDINFO 2001, 2001.

[COO 93] COOPER G., "Probalistic and decision-theoretic systems in medicine", Artificial Intelligence in Medicine, Vol. 5, 1993, p. 289-292.

[COU 93] COUSINS S.B., CHEN W., FRISSE M.E., "A tutorial introduction to Stochastic Simulation Algorithms for Belief Networks", Artificial Intelligence in Medicine, Vol. 5, 1993, p. 315-340.

[CUN 00] CUNNINGHAM, CARNEY J., JACOB S., "Stability problems with artificial neural networks and the ensemble solution", Artificial Intelligence Medicine, Vol. 20, n° 3, 2000, p. 217-225.

[DOM 72] DE DOMBAL F.T., LEAPER D.J., STANILAND J.R., MC CANN A.P., HORROCHS

J.C., "Computer-aided diagnosis of acute abdominal pain", British Medical Journal, Vol. 2, 1972, p. 9-13.

[DEM 77] DEMPSTER A.B., LAIRD N.M., RUBIn D.B., "Maximum Likelihood from Incomplete Data via the EM Algorithm (with discussion)", Journal Royal Statist. Soc.

B., Vol. 39, 1977, p. 1-38.

[DEN 93] DENIER P., LE BEUX P., LENOIR P., "Simulated case-patients to evaluate the

‘A.D.M.’ computer assisted diagnosis system", Proceedings of Medical Informatics in Europ 93, 1993, p. 661-666.

[FON 83] FONTAINE D., LE BEUX P., "An expert system for rubella consultation", Proceedings MEDINFO 83, 1983, p. 529-532.

[FRI 99] FRIEDMAN C.P., ELSTEIN A.S., WOLF F.M., MURPHY G.C., FRANZ T.M., HECKERLING P.S., FINE P.L., MILLER T.M., ABRAHAM V., "Enhancement of clinicians' diagnostic reasoning by computer-based consultation : a multisite study of 2 systems", JAMA, Vol. 282, n° 19, 1999, p. 1851-1856.

(27)

[FRI 00] FRIZE M., WALKER R., "Clinical decision-support systems for intensive care units using case-based reasoning", Med. Eng. Phys., Vol. 22, n° 9, 2000, p.671-677.

[GAM 92] GAMMERMAN A., THATCHER A.R., "Bayesian Diagnostic Probabilities without Assuming Independence of Symptoms", Yearbook of Medical Informatics, 1992, p. 323-330.

[GOL 92] GOLMARD J.L., Les réseaux probabilistes : représentation, utilisation et acquisition des connaissances, Thèse de doctorat en informatique, Université de Paris 6, 1992.

[GRE 90] GRENIER B., Décision médicale, Paris, Masson, 1990.

[GUR 00] GURRIN L.C., KURINCZUK J.J., BURTON P.R., "Bayesian statistics in medical research : an intuitive alternative to conventional data analysis", J. Eval. Clin. Pract., Vol. 6, n° 2, 2000, p. 193-204.

[HAN 01] HANSON C.W., MARSHALL B.E., "Artificial intelligence applications in the intensive care unit", Crit. Care Med., Vol. 29, n° 2, 2001, p.427-435.

[HAU 94] HAUG, GARDNER R.M., TATE K.E., EVANS R.S., EAST T.D., KUPERMAN G., PRYOR T.A., HUFF S.M., WARNER H.R., "Decision support in medicine : examples from the HELP system", Comput. Biomed. Res., Vol. 27, n° 5, 1994, p. 396-418.

[HEA 91] HEARTHFIELD H., ARMSTRONG J., KIRKHAM N., "Object-oriented design and programming in medical decision support", Computer Methods and Programs in Biomedicine, Vol. 36, 1991, p. 239-251.

[HEC 92a] HECKERMAN D.E., HORVITZ E.J., NATHWANI B.N., "Toward Normative Expert Systems : Part I. The Pathfinder Project", Methods of information in Medicine, Vol. 31, n° 2, 1992, p. 90-105.

[HEC 92b] HECKERMAN D.E., NATHWANI B.N., "Toward Normative Expert Systems : Part II. Probability-Based Representations for Efficient Knowledge. Acquisition and Inference", Methods of information in Medicine, Vol. 31, n° 2, 1992, p. 106-116.

[HER 92] HERSKOVITS E.H., COOPER G.F., "Algorithms for Bayesian Belief-Network Precomputation", Yearbook of Medical Informatics, 1992, p. 362-370.

[HUN 00] HUNDBORG H.H., HOJBJERRE M., BJARNE CHRISTIANSEN O., LAURITZEN S.L., "Familial tendency to foetal loss analysed with Bayesian graphical models by Gibbs sampling", Stat Med., Vol. 19, n° 16, 2000, p. 2147-2168.

[JEN 90] JENSEN F.V., OLESEN K.G., ANDERSEN S.K., "An algebra of Bayesian Belief Universes for Knowledge-based Systems", Networks, Vol. 20, 1990, p. 637-659.

[KAS 89] KASSIRER J.P., "Diagnostic Reasoning", Annals of Internal Medicine, Vol. 110, n° 11, 1989, p. 893-900.

[KUL 82] KULIKOWSKI C.A., WEISS S.M., "Representation of Expert Knowledge for Consultation : the CASNET and Expert Projects", Artificial Intelligence in Medicine, Vol. 51, 1982.