• Aucun résultat trouvé

Chapitre 2 – Les promesses de l’utilisation des systèmes d’intelligence artificielle en santé

1. L’intelligence artificielle et les données massives au cœur de l’innovation numérique en

1.2. Intelligence artificielle : différentes manières de valoriser les données massives

1.2.4. L’apprentissage profond

L’apprentissage automatique – en théorie, quel que soit le type de tâche - peut être modélisé par le biais de réseaux de neurones artificiels, modèle computationnel inspiré du fonctionnement des réseaux de neurones biologiques (Alanazi, Abdullah, et Qureshi 2017) aujourd’hui considérés comme des outils standards de data mining (Zhang 2010). Les réseaux de neurones propres à l’apprentissage automatique ont l’avantage de détenir une puissante capacité de modélisation et d’être particulièrement adaptatifs. En effet, le modèle est déterminé par des caractéristiques apprises à partir des données elles-mêmes, même lorsque celles-ci contiennent des informations incomplètes ou du bruit (Zhang 2010). Ces modèles sont particulièrement adaptés à l’analyse de

données collectées dans des contextes réels dont les caractéristiques sont difficiles à définir à l’avance, en particulier lorsque ces caractéristiques sont non-linéaires (Zhang 2010). Le réseau de

self organizing maps de Kohonen (SOM), qui a trouvé plusieurs applications en médecine a, par

exemple, démontré sa pertinence pour des applications telles que l’analyse de données ophtalmiques, la classification d’enregistrements du son des poumons, l’analyse de similarité moléculaire, ou encore celle d’une base de données sur le cancer du sein (Lavrač et Zupan 2010).

De plus en plus, les applications d’apprentissage automatique connexionnistes utilisent une catégorie de techniques appelée apprentissage profond (deep learning) (LeCun, Bengio, et Hinton 2015) - aujourd’hui largement adoptée par la communauté biomédicale et le système de santé (Miotto et al. 2018). Les méthodes d’apprentissage profond utilisent des réseaux de neurones artificiels qui apprennent selon une succession de niveaux correspondant à des niveaux croissants d'abstraction (Dodig-Crnkovic Gordana 2016). Sur la base de modules simples, la représentation d’un niveau (en commençant par l'entrée brute) est transformée en une représentation d’un niveau supérieur, légèrement plus abstrait (LeCun, Bengio, et Hinton 2015). En composant avec suffisamment de transformations d’un niveau à l’autre, des fonctions très complexes peuvent ainsi être apprises (LeCun, Bengio, et Hinton 2015). La différence fondamentale avec les réseaux de neurones classiques (à une seule couche) est le nombre de couches « cachées », leur connexion et leur capacité à apprendre des abstractions significatives à partir des données de manière plus efficace (Miotto et al. 2018). L’aspect essentiel de l’apprentissage profond est que les fonctions des différentes couches ne sont pas conçues par des ingénieurs humains mais apprises à partir des données (LeCun, Bengio, et Hinton 2015). Les algorithmes d’apprentissage profond sont généralisables, soit applicables à de nouvelles combinaisons de valeurs, au-delà de celles apprises durant l'entrainement (LeCun, Bengio, et Hinton 2015).

Les algorithmes d'apprentissage profond ont récemment été développés, entre autres, pour la reconnaissance d’objets, la retranscription des discours en texte, la prédiction de l’activité de molécules médicamenteuses, la reconstruction de circuits neuronaux ou encore la prédiction des effets de mutations de l’ADN sur l’apparition de maladies (LeCun, Bengio, et Hinton 2015). S’ils sont particulièrement prometteurs, ils ont cependant des limites : ils ne sont pas toujours les

algorithmes les plus appropriés (par exemple, d’autres méthodes seront plus adaptées pour l’analyse de données bien structurées et bien définies), ils ont besoin de beaucoup de données pour apprendre et sont considérés comme relativement opaques par rapport aux autres méthodes d’apprentissage automatique (Chartrand et al. 2017).

Différentes applications d’apprentissage profond ont démontré leur utilité en santé. Par exemple, les réseaux de neurones convolutifs (ou convolutional neural networks - CNN) correspondent à l’approche d’apprentissage profond la plus utilisée pour les tâches de traitement d’images – particulièrement efficace pour l’analyse d’images naturelles comme en radiologie (Chartrand et al. 2017; LeCun, Bengio, et Hinton 2015). Le plus récent succès qu’ait connu cette approche est son utilisation pour des tâches de reconnaissance faciale, mais elle connaît également des applications en langage naturel ou reconnaissance vocale (LeCun, Bengio, et Hinton 2015). De nombreuses compagnies développent aujourd’hui des CNN pour permettre des applications de visualisation en temps réel dans les téléphones intelligents, les appareils photos, les robots ou les voitures autonomes (LeCun, Bengio, et Hinton 2015).

Récemment, une des avancées majeures en apprentissage profond est l’usage de Generative

Adversarial Networks (GANs), notamment pour leur application en imagerie médicale (Yi, Walia,

et Babyn 2018; Máttyus et Urtasun 2018). Ces réseaux sont réputés pour leur capacité à générer des images réalistes et nettes (Máttyus et Urtasun 2018). Les GANs correspondent à un modèle d’apprentissage profond où deux réseaux de neurones sont entraînés simultanément, l’un ayant pour objectif la génération d’images (qui permet d’aider l’exploration et la découverte de la structure sous-jacente des données d’apprentissage et la génération de nouvelles images à partir d’elles) et l’autre sur la discrimination de ces dernières (et peut être utilisé comme détecteur) (Yi, Walia, et Babyn 2018). L’idée est de réaliser l’apprentissage en trompant le discriminateur qui essaie de distinguer les exemples réels des exemples créés par le générateur (Máttyus et Urtasun 2018). Leur force est qu’ils apprennent de manière non-supervisée ou minimalement supervisée (Yi, Walia, et Babyn 2018) bien qu’ils fonctionnent mal pour des tâches supervisées classiques (Máttyus et Urtasun 2018). Dans le domaine de l’imagerie, ils ont démontrés être utiles, entre autres, pour la restauration d’images (notamment lorsque des artéfacts ont nui à leur qualité) –

évitant ainsi la répétition d’examens et permettant la génération automatique de rapports, la suppression d’artéfacts ou la détection d’anomalies (Yi, Walia, et Babyn 2018).

Ces différents ensembles de méthodes, techniques et analyses qui relèvent de l’IA, et particulièrement les algorithmes d’apprentissage automatique, sont ainsi autant d’opportunités de donner un sens aux données massives aujourd’hui disponibles (voir Schéma 1). La valorisation de ces données est à la source de nombreuses avenues prometteuses pour le système de santé, que celles-ci concernent le développement de médecine de précision, de systèmes experts d’aide au diagnostic ou de nouveaux agents de soin.

Schéma 1 - Les différents ensembles de méthodes, techniques et analyse qui relèvent de l’intelligence artificielle.