Les systèmes d’aide à la décision médicale

ETAT DES LIEUX

B)- Les systèmes d’aide à la décision médicale

La prise de décision clinique peut être supportée par un ensemble d’outils informatiques dénommés SADM (Système d’Aide à la Décision Médicale). Leur but étant « d’améliorer la qualité des soins et la santé des patients en apportant l’ensemble des informations et connaissances relatives au patient et sa situation clinique en temps et lieux utiles, tout en les filtrant et les présentant de manière convenable et intelligente » (24).

L’académie nationale de médecine (National Academy of Medicine) aux États-Unis reconnait que la qualité des soins peut être optimisée en intégrant ces outils à la pratique médicale. A noter aussi que depuis 2004, le gouvernement fédéral américain encourage l’adoption et l’intégration de ces différents outils dans le système de santé, puisqu’ils ont démontré leurs capacités à améliorer la qualité des soins offerts. (25)

Il existe deux grands types de système d’aide à la décision médicale. D’une part,

les systèmes à base de connaissances où l’intervention de l’expert est indispensable

afin de mettre en place les règles, et qui nécessitent une interface de communication entre la machine et l’utilisateur. Et d’autre part, les systèmes utilisant le maching

learning (apprentissage automatique) permettant à la machine d’apprendre et

d’extraire les informations pertinentes d’une base de données (big data), et de déterminer le lien entre ces données.

Figure 3 : Les différentes formes d'intelligence artificielle utilisée en médecine.

1)- Les systèmes à base de connaissances

Le point de départ de la conception et la réalisation d’un système d’aide à la décision médicale nécessite la détermination de ses objectifs en passant par l’analyse des besoins des utilisateurs et des caractéristiques des problèmes posés.

Ces objectifs dépendent de plusieurs paramètres (17) : - La nature des problèmes identifiés.

- Les futurs utilisateurs de ce système, leurs fonctions et leurs connaissances, ainsi que la forme de l’interface d’interactions utilisateur-système souhaitée.

- Le degré d’aide à la décision désirée. - Les fonctions attendues.

Ainsi, il existe plusieurs catégories de systèmes en fonction de leurs modalités d’intervention selon une étude commanditée par la HAS (Haute Autorité de Santé) (26) :

 Les systèmes d’aide à la documentation des soins  Les systèmes d’alertes ou rappels automatisés  Les systèmes consultants (les systèmes experts)

a)- Les systèmes d’aide à la documentation des soins (26)

L’objectif de ces systèmes est de mettre à la disposition du clinicien des outils facilitant le recueil des données cliniques, reposant principalement sur « des formulaires électroniques ». Ils permettent la saisie simple et rapide des données pertinentes en fonction du contexte clinique du patient. Ces outils sont intégrés dans la démarche clinique avec la capacité de rappeler à l’utilisateur des informations importantes à prendre en compte.

Ce sont des systèmes d’aide indirecte à la prise de décision dit « passifs », c’est-à-dire qu’ils n’ont pas une méthode de raisonnement à proprement parler, mais sont capables de gérer une base de données.

La conception des formulaires électroniques pour un problème donné est basée sur « les connaissances contenues dans les recommandations de pratiques ». Ils représentent également un moyen efficace de rassemblement de données structurées et de qualité, à partir desquelles peuvent être réalisés des systèmes plus complexes.

Plusieurs systèmes d’assistance documentaire ont vu le jour, parmi eux le système d’aide au diagnostic médical ADM (27).

b)- Les systèmes d’alertes ou rappels automatisés

Ces programmes surveillent les données cliniques saisies ou importées dans le dossier du patient. Ce sont des systèmes qui fonctionnent en arrière-plan.

Leur objectif étant de déclencher automatiquement une intervention qui est destinée à :

- Avertir le clinicien d’une erreur ou d’un danger potentiel sous forme d’alerte. - Servir de rappels ou d’aide-mémoire en fonction du contexte clinique.

b.1)- Les alertes (26)

Il s’agit de systèmes qui ont démontré un réel apport de qualité et de sécurité par rapport à la prescription des médicaments, et peuvent être utilisés pour :

- La détection d’un danger lié à la prescription d’un médicament donné, comme une allergie médicamenteuse, une contre-indication ou une interaction médicamenteuse.

- Notification d’un résultat de laboratoire important ou l’arrivée d’un nouveau résultat.

- Détecter des erreurs de posologie, d’examens ou de traitements inappropriés au contexte clinique.

b.2)- Rappels ou aide-mémoires (26)

Le mode de fonctionnement est quasiment semblable aux alertes, mais sont déclenchés uniquement sous certaines conditions spécifiques. Ils sont majoritairement utilisés pour des actions de prévention et de dépistage, et pour l’implémentation des recommandations de pratiques.

Les fonctions de ce type de SADM peuvent être déclenchés automatiquement lors :

- De l’approche de la date de réalisation d’un acte de prévention ou de surveillance. (HbA1C pour un patient diabétique n’ayant pas réalisé l’examen depuis plus de 6 mois par exemple)

- De la notification d’un problème ou un diagnostic. (suggestion d’un traitement anticoagulant lorsqu’une thrombose veineuse est diagnostiquée ou lorsqu’il s’agit d’un évènement extrêmement probable au cours de l’évolution de la maladie du patient)

- La prescription d’examens complémentaires (rappeler par exemple au médecin prescripteur d’une rectosigmoïdoscopie que la coloscopie est l’examen standard dans certaines situations)

Chen et al. ont développé un SADM permettant d’éviter à ses utilisateurs de prescrire des traitements antiépileptiques inutiles et de rappeler aux praticiens les règles de surveillance de ces traitements. (28)

c)- Les systèmes consultants (systèmes experts)

À partir d’un contexte clinique défini, ces systèmes sont capables de raisonner et de fournir aux praticiens des conclusions argumentées en fonction de la méthodologie utilisée (17).

Ces programmes jouent le rôle de l’expert humain : à partir des connaissances spécialisées sur lesquelles ils appliquent des méthodes de raisonnement, ces derniers peuvent fournir des conseils et suggestions par rapport à leur domaine d’expertise (29).

 Composantes et fonctionnement d’un système expert

La conception d’un système à base de connaissance passe par le stockage des connaissances relatives au problème par l’expert dans une base de connaissances sous forme de règles à appliquer, et qui est séparée du programme conçu pour les gérer, ce dernier dénommé « moteur d’inférence ». Les règles sont indépendantes les unes des autres.

L’utilisateur va ensuite recueillir l’ensemble des données et faits concernant le patient, qui seront stockés dans une base de faits appelée mémoire de travail via une interface propre à l’utilisateur

La base de connaissances et la base de faits sont ainsi les outils et les matériaux du moteur d’inférence qui lui permettent de construire ses raisonnements. Ce dernier examine la base de fait, et détecte les connaissances pertinentes à appliquer aux faits, construit un plan de résolution et propose des suggestions via une interface

utilisateur. Par analogie, le moteur d’inférence représente le « cerveau » du système.

Figure 4 : Architecture d'un système expert

Un système expert est alors constitué de 3 composantes : une représentation des connaissances (base de connaissances et de faits), qui dans notre cas seraient les connaissances d’une spécialité ou d’un problème médical donné, un ou plusieurs moteurs d’inférence, et une interface de dialogue avec l’utilisateur.

2)- Le Machine Learning (Apprentissage Automatique)

Le domaine du « BIG DATA » est en train de transformer la pratique médicale du 21^ème siècle, tout clinicien aura à faire un jour ou l’autre à ce type technologies dans sa pratique médicale.

Selon une étude récente du magazine américain Forbes (30), 2,5 quintillion de données sont produites chaque jour. L’intelligence artificielle classique et le cerveau humain étant incapables de traiter une telle quantité de données, le maching learning offre des outils puissants capables de réaliser une telle tâche.

Le machine learning est une branche majeure de l’intelligence artificielle, et celle qui a connu le plus de progrès au cours des deux dernières décennies. Elle est définie comme un ensemble d’algorithmes qui permettent à la machine d’apprendre grâce à l’expérience. Ces algorithmes ont la capacité d’apprendre les règles à partir des données en s’entraînant sur des exemples, pour ensuite les appliquer sur de nouvelles données, avec la capacité de s’améliorer constamment grâce à l’expérience et au fur et à mesure que la machine obtient de nouveaux exemples d’apprentissage. (31)

Les algorithmes du maching learning ont été, dès leur apparition, exploités dans l’analyse des données médicales. En effet, la plupart des hôpitaux modernes ont à leur disposition des outils de rassemblements des données, constituant la matière première du maching learning, faisant de ces technologies un outil indispensable à l’analyse de ces banques de données. (31)

Il existe plusieurs types d’apprentissage. On distingue l’apprentissage automatique supervisé, non supervisé, semi-supervisé, partiellement supervisé, l’apprentissage par renforcement et par transfert. Nous allons principalement étudier les méthodes d’apprentissage supervisé et non supervisé, puisque ces derniers peuvent présenter un réel apport dans la prise en charge des patients de façon générale, et plus particulièrement des patients présentant une uvéite.

a)- Apprentissage automatique non supervisé (unsupervised learning)

Les algorithmes du machine learning apprennent les règles à partir des exemples. Pour qu’on puisse parler d’apprentissage automatique non supervisé, ces exemples ne sont pas étiquetés préalablement par un expert. Le système ne dispose que de données

(exemples non étiquetés), qui sont analysés afin de déterminer l’existence d’un lien entre ces dernières : la machine réalise un travail de regroupement (clustering). Elle essaye de faire émerger des classes et de déterminer les structures sous-jacentes des données. (32)

 Exemple : En épidémiologie, ces techniques peuvent être utilisés sur un groupe d’individus présentant une maladie donnée dont les caractéristiques épidémiologiques ne sont pas ou bien connus. Le rôle de la machine serait de dégager des sous-groupes parmi ces individus, ayant des caractères en commun. Un de ces sous-groupes pourrait représenter un facteur de risque propre à cette maladie, encore inconnu : il s’agit d’une méthode d’exploration, qui est le principe même du « Data mining » dit « minage ou forage » des données.

Figure 5 : Clustering de données non étiquetées par un algorithme d'apprentissage non supervisée. (33)

b)- Apprentissage automatique supervisé (supervised learning)

Contrairement à l’apprentissage non supervisé, les exemples à partir desquels la machine apprend sont étiquetés préalablement par un expert. Une fois l’apprentissage du modèle terminé, il sera capable d’interpréter un nouvel exemple qu’il ne connaît pas.

Ces exemples peuvent être sous formes d’images de radiologies étiquetées par des radiologues, des données de patients hospitalisés, diagnostiqués et traités, ou encore les données relatifs à l’évolution de l’état général et les caractéristiques (antécédents, profil génétique) de plusieurs patients présentant une pathologie donnée. Tous ces exemples, ayant été étiquetés par des professionnels, disponibles dans une base de données en grande quantité, peuvent servir à entrainer des modèles qui seront capables d’interpréter des images radiologiques de nouveaux patients, aider les cliniciens à poser certains diagnostics, ou encore prédire le pronostic – en cancérologie par exemple - afin d’anticiper l’évolution de la maladie et intervenir avec les différents outils thérapeutiques disponibles.

Figure 6 : Différentes étapes de conception d'un modèle d'apprentissage supervisé. Chacune de ces étapes affecte le rendement, la performance et la qualité du modèle. (34)

 Exemple : Pour bien comprendre ce mode d’apprentissage, prenant comme exemple un algorithme qui utilise l’apprentissage supervisé pour interpréter une radiographie. On donne au modèle algorithmique un très grand nombre de radiographies dont les résultats sont connus et posés par des radiologues (il s’agit d’exemples étiquetés, et donc du training set qui guidera l’apprentissage). Une fois l’apprentissage terminé, le modèle algorithmique pourra interpréter une nouvelle radiographie d’un nouveau patient en temps et lieux utiles.

Figure 7 : Différentes étapes d'apprentissage de ChestX-Ray8, modèle algorithmique capable de classifier et de détecter les lésions élémentaires sur radiographie standard,

développé par Xiaosong Wang et al. (35)

Plusieurs types d’algorithmes permettent un apprentissage automatique supervisé, chacun pouvant être plus adapté que l’autre dans une situation donnée. On cite les machines à vecteurs de support (Support Vector Machine), les réseaux de neurones artificiels (Deep Learning), les forêts d’arbres décisionnels (Random Forests), les algorithmes génétiques, la régression logistique etc.

Trois de ces algorithmes d’apprentissage supervisé nous intéressent particulièrement, et seront utilisés dans la conception du modèle expérimental. Il s’agit des réseaux de neurones artificiels, des machines à vecteur de support, et les forêts d’arbres décisionnels.

b.1)- Les réseaux de neurones artificiels (Deep learning / Apprentissage profond) (22,23,32)

L’apprentissage profond dit « Deep Learning » est un ensemble de méthodes d’apprentissage automatique supporté par un ensemble de modèles connexionnistes dit « réseau de neurones artificiels », et est largement utilisé dans le domaine médical, ce dernier étant parfaitement adapté à plusieurs situations rencontrées en médecine.

 Fonctionnement d’un réseau de neurones artificiels

L’être humain s’est toujours inspiré de la nature pour créer ses propres outils. Pour créer une intelligence artificielle capable d’apprendre, les scientifiques se sont inspirés de la structure des neurones humains, substrat de l’intelligence humaine, dont le fonctionnement permet la mise en place des différentes fonctions de raisonnement, de logique et d’abstraction, pour donner place aux réseaux de neurones artificiels. Ces derniers miment le fonctionnement des différentes couches des neurones, considéré comme profond, d’où le nom ces méthodes d’apprentissage dit

« apprentissage profond », Deep Learning en anglais.

Prenons comme exemple un réseau de neurones artificiels composés de 6 neurones. On détaillera la structure de ce dernier, son fonctionnement et comment ce dernier est appliqué dans le domaine médical.

 Architecture du réseau de neurones artificiels

Figure 8 : Architecture d'un réseau de neurones artificiels.

- N = neurone.

- Chaque neurone est connecté aux neurones précédents : N3, N4 et N5 sont connectés à N1 et N2. N6 est connecté à N3, N4 et N5.

- Chaque neurones appartient à une famille : N1 et N2 appartiennent à la famille des entrées (inputs), N3, N4 et N5 appartiennent à la famille des couches cachées

(hidden layers, d’où le terme « deep ») : elles sont dites cachées car on ne connait ni

leurs entrées ni leurs sorties, N6 appartient à la famille des sorties (Outputs).

- Deux neurones de la même famille ne sont jamais connectés entre eux. Il est important de noter qu’on peut avoir autant de neurones et de couches cachées que l’on souhaite.

Figure 9 : Les différentes familles de neurones artificiels.

 Traitement de l’information

- L’information se déplace dans une seule direction, elle répond à la règle de la propagation en avant (Feed Forward). Ainsi, on attribue pour chaque neurone de la famille des entrées (inputs) une valeur : autrement dit, on alimente le réseau de données. Comme on l’a expliqué précédemment, chaque neurone est connecté aux neurones précédents, cette connexion présente un poids (weight).

- Les valeurs des neurones de la famille des entrées seront combinées selon une formule mathématique et multipliées par le poids de la connexion pour donner une nouvelle valeur qui représente la valeur du neurone de la couche cachée.

- Le neurone de la couche cachée ayant reçu sa valeur, va pouvoir la modifier grâce à une formule mathématique dite « fonction d’activation », et dont le rôle est de déterminer si l’information peut passer au prochain neurone ou pas.

- L’information continue à se propager jusqu’à obtenir une valeur pour le dernier neurone de la famille des sorties (outputs).

Figure 10 : Fonctionnement d'un réseau de neurones artificiels.

- Dans cet exemple, le réseau de neurones n’a pas encore été entrainé et les poids sont mis de façons aléatoires. Le poids de la première connexion (W1) est supérieur au poids de de la deuxième connexion (W2)

- Supposons que pour les valeurs de N1 (0.3) et N2 (0.8) de ce réseau (N1 et N2 représentent le training set), on s’attend à une sortie de 0,8 mais on obtient une sortie de 0.5. L’algorithme va alors déterminer une fonction d’erreur grâce à une technique dénommée « rétropropagation du gradient » à partir de laquelle il va modifier les poids des connexions jusqu’à obtenir la valeur attendue : c’est ce qui définit la propriété

d’apprentissage du réseau.

 Comment applique-t-on ces algorithmes en médecine ?

Prenons l’exemple des algorithmes capables d’interpréter des radiographies. On expliquera comment un algorithme est capable de reconnaître une image simple, le même principe est appliqué pour des images plus complexes.

 Exemple : reconnaissance du numéro 6 sur une image.

Pour que le réseau de neurones puisse apprendre, il est alimenté de données qu’il peut comprendre. La première étape consiste à digitaliser l’information : une image est constituée de pixels, on attribuera pour chaque pixel un nombre entre 0 et 1 (0 pour le noir, 1 pour le blanc), ce sont les entrées du réseau de neurones (inputs).

Figure 11 : Digitalisation d'une image.

Dans l’exemple ci-dessus, la couche des entrées contient 54 neurones correspondants aux pixels de l’image. Chaque neurone à une valeur de 0 ou 1. L’information va ensuite se propager vers les neurones de la couche cachée dont le rôle sera de segmenter l’image et déterminer le lien entre les différentes données pour ensuite aboutir à une valeur de sortie.

Le concepteur du réseau s’attend à une valeur de sortie préalablement déterminée puisque l’exemple est connu et étiqueté. Au début de son apprentissage, le réseau de neurones trouvera des valeurs erronées, pour lesquelles il va déterminer la fonction d’erreur pour corriger les poids entre les neurones et aboutir à la valeur attendue. Une fois l’entrainement du réseau terminé, Le réseau sera capable de reconnaître le numéro « 6 » sur une nouvelle image.

Le même principe est généralement appliqué à l’interprétation d’image en radiographie avec des variations dans le mode d’apprentissage : chaque radiographie contient un certain nombre de pixels qui devra être le même pour toutes les radiographies du training set (radiographies étiquetées dont le résultat est connu), chaque pixel aura une valeur et représentera une entrée du réseau de neurones. On obtient à terme un réseau de neurones artificiels proposant un modèle mathématique capable d’interpréter le type de radiographie qu’on souhaite.

Un algorithme basé sur ces techniques de deep learning permettant de détecter la présence de nodules pulmonaires dans une radiographie du thorax a été développé par des chercheurs du département de radiologie du Seoul National University Hospital and College of Medicine (36), ces derniers ont utilisé 43 292 radiographies du thorax préalablement étiquetées par des radiologistes pour entrainer l’algorithme qui, à terme, a démontré une performance parfois supérieure aux radiologistes dans la détection de ces nodules.

Une autre étude a permis la conception d’un algorithme capable de reconnaître les lésions élémentaires dans une radiographie de thorax avec un training set de 108 948 radiographies du thorax (35).

b.2)- Les forêts d’arbres décisionnels (Random Forests)

Ce sont des algorithmes d’apprentissage automatique supervisé qui permettent de réaliser des tâches de classification ou de régression. Ils effectuent un apprentissage sur de multiples arbres de décision entrainés sur des sous-ensembles de données légèrement différents (37). Ils ont été introduits par Breiman en 2001 (38).

Pour bien comprendre le fonctionnement d’une forêt d’arbres décisionnels dite également « forêt aléatoire », il faut connaitre la structure d’un arbre de décision et sa méthode de construction. Nous nous intéresserons principalement aux arbres de classification (Classification Trees).

L’arbre de décision est un outil d’aide à la décision qui permet de représenter un ensemble de décisions sous la forme d’un arbre. Ce dernier modélise une hiérarchie de tests (variables) pour prédire un résultat. (38)

 Structure d’un arbre de décision (37)

L’arbre de décision est constitué de plusieurs nœuds : le premier nœud de l’arbre est défini comme étant la racine (Root) de l’arbre, ce dernier se sépare en plusieurs

d’apprentissage, sa branche représentant le résultat du nœud, pour s’arrêter aux derniers nœuds qu’on appelle feuilles (leafs). Ces derniers représentent les décisions possibles.

Figure 13 : Structure générale d'un arbre de décision.

 Construction d’un arbre de classification (37,39)

Le choix de la racine et des nœuds internes se fait à partir des variables du training set. Afin de déterminer le niveau hiérarchique des variables (1 à 4 dans l’exemple ci-dessus), un critère d’évaluation de l’homogénéité est calculé pour chacune d’elles (critère de split). Les plus utilisés sont les critères de l’Entropie et de

Gini.

La variable ayant le Gini le plus petit sera utilisée comme racine de l’arbre. Ce critère représente la qualité de partage pour obtenir le meilleur partage possible.

Dans le document L’APPORT DE L’INTELLIGENCE ARTIFICIELLE DANS LA PRISE EN CHARGE DE L’UVEITE EN MEDECINE INTERNE (Page 55-84)