• Aucun résultat trouvé

L’intelligence artificielle pour améliorer la détection d’adénomes dans la coloscopie de dépistage : le futur est déjà là !

N/A
N/A
Protected

Academic year: 2022

Partager "L’intelligence artificielle pour améliorer la détection d’adénomes dans la coloscopie de dépistage : le futur est déjà là !"

Copied!
4
0
0

Texte intégral

(1)

L ’ intelligence arti fi cielle

pour améliorer la détection d ’ adénomes dans la

coloscopie de dépistage : le futur est déjà là !

Arti fi cial Intellignecy for increasing the adénoma detection rate during screening colonoscopy: The future is already here!

Jean-Michel Gonzalez Aix-Marseille Université, AP-HM, Hôpital Nord, Service de gastroentérologie, Marseille, France

Correspondance : J"M. Gonzalez jmgonza05@yahoo.fr

Référence

Urban G, Tripathi P, Alkayali T, Mittal M, Jalali F, Karnes W, Baldi P. Deep Learning Localizes and Identifies Polyps in Real Time With 96 % Accuracy in Screening Colonoscopy.

Gastroenterology2018 ; 155 (4) : 1069-1078.e8. doi : 10.1053/j.gas- tro.2018.06.037. Epub 2018 Jun 18.

D

ans la tendance actuelle, cette étude évalue un système d’intelligence artificielle avec auto-apprentissage (Deep Learning) appelé CNN (Conventionnal Neural Network) pour la détection de polypes au cours de la coloscopie de dépistage.

Introduction et rationnel de l’étude

Le cancer colorectal (CCR) est au troisième rang des cancers les plus fréquents en France, et la seconde cause de décès liée au cancer y compris aux États-Unis.

La prévention de ce cancer par l’ablation de polypes adénomateux lors de coloscopies de dépistage permettrait d’en éviter 70 à 90 %. Or, on sait que malgré des coloscopies régulières, des cancers d’intervalle se développent dans 7 à 9 % des cas, et que dans 85 %, ils sont dus à des polypes ratés ou mal réséqués. Par ailleurs, le risque d’avoir un adénome dans la population générale après 50 ans est de 50 %, ce qui devrait donc correspondre au taux de détection d’adénome (TDA) de chaque gastroentérologue. En réalité, dans les différentes études, ce taux varie de 7 à 53 % et dans les études de coloscopie en tandem, il est montré qu’environ 25 % des polypes sont ratés de même que 5 % des CCR. Enfin, on sait également que le TDA dépend de l’expérience de l’opérateur, de la qualité de préparation, de la technique/durée du retrait, ainsi que d’autres facteurs. Lorsqu’on augmente le TDA de 1 %, on diminue le taux de cancer d’intervalle de 3 à 6 %.

Lorsqu’on augmente le taux de détection des adénomes de 1 %, on diminue le taux de cancer d’intervalle de 3 à 6 % Plusieurs technologies ont été développées pour améliorer ce taux de

détection, que ce soit en termes d’imagerie (chromoendoscopie,fluorescence, etc.), par un élargissement de l’angle de vue (Système Fuze, etc.), ou par des dispositifs rajoutés à l’extrémité de l’endoscope. Cependant aucune n’a permis de démontrer de manière constante et significative une amélioration des performances du TDA. L’analyse d’image assistée pourrait donc dans ce contexte aider à l’améliorer, et commence à se développer. Le «Deep Learning» a déjà montré son efficacité dans de nombreux domaines de la science et l’intelligence artificielle avec le modèle CNN est un modèle très efficace dans l’analyse d’images. Idéalement, un module d’assistance à la détection de polypes doit avoir deux caractéristiques : une sensibilité de 1

Pour citer cet article : Gonzalez JM. Lintelligence articielle pour améliorer la détection dadénomes dans la coloscopie de dépistage : le futur est déjà là !. Hépato-Gastro et Oncologie Digestive 2019 ; 26 : 123-126. doi :10.1684/hpg.2018.1717

CONCEPTS ET PRATIQUE

Copyright : John Libbey Eurotext, 2019 Hépato-Gastro et Oncologie digestive/123

doi :10.1684/hpg.2018.1717 Volume 26Numéro 1janvier 2019

(2)

(avec une aire sous la courbe proche de 1 aussi pour ne pas augmenter les faux positifs) et une capacité d’analyse de 30 images par seconde pour être applicable à une coloscopie. Les objectifs de l’étude étaient de proposer un dispositif qui surmonte ces deux contraintes majeures.

Matériels et méthodes Réseau neuronal CNN

Il s’agit d’un système de détection d’image par intelli- gence artificielle (IA), capable d’apprendre après un entraînement. Plusieurs versions de ce CNN ont été pré- entraînées d’abord avec leImageNet data corpus (base de données d’images généralistes) puis avec des données plus spécifiques (images de polypes). L’objectif de cet entraînement était la localisation des lésions ainsi que leur détection et leur caractérisation, avec des méthodes dédiées. En parallèle, d’autres techniques ont été utilisées pour diminuer le risque de sur-apprentissage. À l’issue de cet entraînement ont été conservées plusieurs versions du CNN, au meilleur de leur performance.

Expériences

Six différents ensembles de données issues d’images d’endoscopie ont été utilisés pour entraîner et évaluer versions choisies du CNN : 1) le set ImageNet, qui contient 1,2 millions images généralistes (objets, animaux, etc.) ; 2) un échantillon de plus de 8 000 images de coloscopie dont 50 % contenant des polypes, en lumière blanche ou NBI, dans toutes les zones du côlon, et dont certaines images avec des outils (pinces, anses, etc.) ; 3) un second échantillon de 1 330 images de coloscopie (avec et sans polypes) ; 4) neuffilms de coloscopies ; 5) 44 000 images (> 13 000 polypes) issues de ces 9 vidéos ; 6) les images de 11 autresfilms de coloscopies dites « difficiles ». Au total, l’ensemble des vidéos représente une durée de 5 heures.

Tous les supports d’image ont été traités de la même manière en termes de taille et de résolution pour les tests.

Les modèles « détection de polype » et « localisation » ont été entraînés séparément pour éviter les facteurs confondants. Par ailleurs, concernant la localisation, le modèle prédisait la taille et localisait le polype dans un cadre vert sur l’image, permettant une analyse en temps réel. Ainsi, différents types d’entraînement du modèle de

localisation ont été essayés, de même que différentes architectures du CNN.

Le Conventionnal Neural Network est un modèle d’intelligence artificielle avec auto- apprentissage, spécialisé dans l’analyse d’image, qui a été entraîné puis évalué pour la détection et la localisation de polypes, en temps réel

Une fois l’entraînement terminé, cinq modèles ont été

conservés : trois pré-entraînés (PI-CNN 1, 2 et 3) et deux non pré-entraînés (NPI-CNN1 et 2). Les tests de détection réalisés étaient : 1) validation croisée sur les 8 461 images ; 2) entraînement sur les 8 461 mages + évalua- tion sur les 20 vidéos et le second échantillon d’images ; 3) entraînement sur les 8 461 images et 9 vidéos + évaluation sur les 11 autres vidéos et le échantillon d’images. En parallèle, il a été demandé à trois coloscopistes experts (TDA > 50 %) d’identifier tous les polypes du groupe de 9 vidéos. Les résultats étaient combinés par consensus. Ensuite, sur ces mêmes vidéos, était ajouté un cadre vert sur chaque image où un polype avait été détecté par le CNN, à l’endroit où il avait été détecté (CNN-vidéo). Les experts relisaient enfin ces CNN- vidéos et validaient la présence de chaque polype, avec un niveau de confiance. Une analyse de contingence a ensuite comparé les accords entre l’expert et les réponses du CNN. La même analyse a été répétée une deuxième fois avec les 11 autres vidéos.

Résultats

Détection et localisation des polypes

Concernant la détection de polypes, le meilleur modèle était le PI-CNN2(tableau 1)qui était pré-entraîné par le ImageSet (contrairement aux deux premiers) offrant une précision diagnostique de 96,9 % avec une aire sous la courbe de 0,97. Pour des seuils de sensibilité de 90 % et de 97 %, les taux de faux positifs étaient respectivement de 0,5 % et 6,6 %, ce qui reste très faible et acceptable.

De plus, les lésions planes étant les plus difficiles à identifier et responsables des cancers d’intervalle, les auteurs ont revu un échantillon de 1 578 faux positifs et 228 faux négatifs pour les polypes, qui ont été classés

TABLEAU 1Résumé des classifications de l’architecture des polypes obtenue par une validation croisée (7 plis) sur les 8 641 images de coloscopie. La sensibilité est donnée pour des taux de faux négatifs à 1 % et 5 %, car elles sont indépendantes.

Modèle Poids initial Précision AUC Sensibilité avec

faux négatifs à 5 %

Sensibilité avec faux négatifs à 1 %

NPI-CNN1 91,90,2 % 0,9700,002 88,1 % 65,4 %

NPI-CNN2 91,00,4 % 0,9660,002 86,2 % 60,6 %

PI-CNN1 VGG16 95,90,3 % 0,9900,001 96,9 % 87,8 %

PI-CNN2 VGG19 96,40,3 % 0,9910,001 96,9 % 88,1 %

PI-CNN3 ResNet50 96,10,1 % 0,9900,001 96,8 % 88,0 %

CONCEPTS ET PRATIQUE /

L’intelligence artificielle pour améliorer la détection d’adénomes

124/Hépato-Gastro et Oncologie digestive Volume 26Numéro 1janvier 2019

(3)

selon Paris et dont la taille a été évaluée(tableau 2). Le CNN a raté 12 % de lésion polypoïdes contre 11 % de lésions planes. Le CNN est donc autant performant quel que soit le relief des lésions.

Concernant la localisation des polypes, il a été démontré que les modèles pré-entraînés (PI-CNN 1 et 2) étaient significativement meilleurs (p = 0,003) dans la localisation des polypes que les modèles non pré-entraînés.

Les modèles pré-entraînés sont les plus performants pour la détection et la localisation de polypes, avec une précision diagnostique de 97 %

Analyse des coloscopies (vidéos) avec les experts

Sur les 9 premières coloscopies, les opérateurs initiaux avaient enlevé 28 polypes, les experts en ont identifié 36, et le CNN 45. Ce dernier n’a manqué aucun polype unique (tableau 3). De plus, la sensibilité et la spécificité des prédictions du CNN en comparaison avec celle des experts lorsqu’ils ont analysé CNN-vidéo, était de 0,93 dans les deux cas. Dans les 11 autres vidéos de coloscopies difficiles, les experts ont identifié 73 polypes, et le CNN 68. Cependant, une version améliorée du CNN obtenue

après la première série de vidéos a elle identifié 72 des 73 lésions, suggérant que le modèle continue de s’améliorer avec l’entraînement. Une analyse supplémentaire a également montré qu’entraîner le CNN avec des images de NBI et de lumière blanche était mieux que de l’entraîner uniquement avec du NBI.

En comparaison avec les experts, le modèle d’intelligence artificielle a détecté plus de lésions avec en plus une capacité d’apprentissage et donc d’amélioration des performances

Commentaires

L’intelligence artificielle émerge de plus en plus dans différents domaines de la médecine, à commencer par l’imagerie. Plus récemment, elle a fait son apparition en endoscopie, avec des progrès technologiques accomplis sur les deux dernières années et un nombre croissant de publications [1]. Cette étude est dans la lignée des précédentes qui avaient déjà montré des précisions supérieures à 90 % pour la détection de polypes avec des aires sous la courbe de 0,99, sur l’analyse d’images fixes par différents modèles d’IA. Cela laissait déjà entrevoir tout le potentiel de l’IA et des modèles d’apprentissage autonome pour améliorer le TDA et donc la qualité du dépistage. Un des problèmes techniques qui persistait était que cette analyse restait lente et donc ne pouvait être applicable à une coloscopie en temps réel. En utilisant ce modèle de CNN soumis à un entraînement ultra-intensif, d’abord sur des millions d’images aspécifiques puis sur des milliers d’images de coloscopie, statiques et sur vidéos, les auteurs ont obtenu une vitesse d’analyse de 98 images par seconde. C’est quatre fois supérieur à ce qui est nécessaire pour une analyse en temps réel, tout en gardant la même précision diagnostique (96 %). Outre cette avancée technologique majeure, ils ont montré plusieurs choses : 1) le relief (polyploïde ou plan) n’avait pas d’impact sur les performances de détection du CNN, contrairement à celles de l’homme ; 2) dans les analyses de vidéos, le CNN trouvait plus de polypes que les experts en conditions normales. En cas de conditions difficiles, la non-détection des polypes était liée à un passage trop rapide de l’endoscope (non corrigé par le CNN) et, d’autre part, en faisant subir un entraînement additionnel au modèle, il apprenait et améliorait ses performances. Par consé- quent, un pas a été franchi vers l’application de l’intelligence artificielle dans l’imagerie endoscopique et la détection de lésions.

Un pas a été franchi vers l’application de l’intelligence artificielle dans l’imagerie endoscopique et la détection de lésions, avec la possibilité d’analyse en temps réel à performance diagnostique égale

TABLEAU 2Catégorisation dun ensemble aléatoire de 1 578 vrais positifs et 228 faux négatifs de prédictions de polypes faites par le CNN, sur lensemble test de 4 088 polypes uniques, et catégorisées par taille et classification de Paris.

Vrais positifs Faux négatifs 1 cm > 1 cm 1 cm > 1 cm

Dim < 3 mm 644 - 103 -

0-Ip 37 25 8 6

0-Is 487 45 68 2

0-IIa 246 37 36 4

0-IIb 34 15 1 0

0-IIc 4 4 0 0

TABLEAU 3Polypes uniques réséqués par lopérateur initial pendant 722 coloscopies, détectés par l’expert (lors de la relecture), et détectés par l’expert assisté de la détection par le modèle CNN sur les 9 vidéos.

Taille des polypes (mm)

Opérateur initial

Relecture par expert

Relecture par CNN

1-3 12 19 24

4-6 12 13 16

7-9 0 0 1

> 10 4 4 4

Nb total de polypes 28 36 45

L’intelligence artificielle pour améliorer la détection d’adénomes

/ CONCEPTS ET PRATIQUE

Hépato-Gastro et Oncologie digestive/125

Volume 26Numéro 1janvier 2019

(4)

Cette tendance est renforcée par la littérature, car deux autres études sont parues dansGastroenterology cette année sur l’IA et la détection de polypes. La première par une équipe japonaise qui a montré qu’un modèle d’IA entraîné sur bandes vidéos permettait une détection de 94 % des polypes, avec une excellente sensibilité [2, 3].

La deuxième par une équipe taïwanaise, focalisée sur la détection des polypes diminutifs (< 6 mm). Elle a démontré sur environ 1 500 images que le modèle d’IA classait les lésions en hyperplasique ou en adénome avec une sensibilité de 96 %, et des valeurs prédictives positives et négatives de 90 %, et ce, plus rapidement que l’homme en comparaison. Ces trois études confir- ment bien cette tendance qui s’accélère, mais il reste quelques questions techniques : l’implémentation sur nos endoscopes actuels, même si certaines firmes sont bien avancées, le comportement du coloscope et de l’endos- copiste avec cet outil surajouté, le temps de descente optimal, la forme sous laquelle les lésions seront

identifiées (cadre vert ?). Enfin, il restera le problème du coût, même si une amélioration drastique de la détection et donc une diminution du risque de cancer colorectal permettra probablement de justifier et contre- balancer ce coût.

Liens d’intérêts :

l’auteur déclare n’avoir aucun lien d’intérêt en rapport avec l’article.

Références

1Alagappan M, Brown JRG, Mori Y, et al. Articial intelligence in gastrointestinal endoscopy: The future is almost here.World J Gastrointest Endosc2018 ; 10(10) : 239-49.

2Misawa M, Kudo SE, Mori Y,et al. Artificial intelligence-assisted polyp detection for colonoscopy: Initial experience.Gastroenterology2018 ; 154(8) : 2027-9.

3Chen PJ, Lin MC, Lai MJ,et al. Accurate classification of diminutive colorectal polyps using computer-aided analysis.Gastroenterology2018 ; 154 (3) : 568-75.

Vous souhaitez recruter un médecin pour compléter votre équipe médicale ?

Contactez Corinne Salmon 01 46 73 06 63

corinne.salmon@jle.com ou connectez-vous sur la rubrique Petites annonces de notre site www.jle.com

Pour une diffusion maximale de votre petite annonce

> dans la revue de votre choix parmi

toutes nos revues

> sur notre site www.jle.com

CONCEPTS ET PRATIQUE /

L’intelligence artificielle pour améliorer la détection d’adénomes

126/Hépato-Gastro et Oncologie digestive Volume 26Numéro 1janvier 2019

Références

Documents relatifs

Les étudiants ayant acquis à la fin de la 1ère année du Master Informatique des connaissances approfondies théoriques et pratiques dans divers domaines

Un ´ enonc´ e est valide s’il est vrai dans tous les mod` eles..

Les objets et relations sont des primitives de la s´ emantique Syntaxe : constantes, fonctions, pr´ edicats, ´ egalit´ e, quantifieurs. Augmentation du pouvoir expressif :

Le chercheur en télédétection aimerait avant tout pouvoir développer ses algorithmes avec le moins d'entraves possible. S'il décide de tout développer lui- même, il fait face à

Dans le cadre du d epistage et de la pr evention du CCR, le TDA ne peut pas ^ etre consid er e a l’ echelon individuel, comme un « standard de soin » opposable et contraignant

Les propos d’A. de la Garanderie nous amènent à dire que la manière dont l’acte d’enseignement est organisé peut constituer l’origine des difficultés de

Q₂ Pour chacune des valeurs de k précédemment determinées, trouver tous les entiers réversibles de

Dans sa définition large, le domaine de « l’intelligence artificielle » (IA) peut être distingué en deux grandes classes avec d’un côté l’IA symbolique et de l’autre