• Aucun résultat trouvé

Exemple de réseau de neurones récurrents déroulé sur H instants temporels

non deux pour des images. Un autre type de réseau de neurones populaire ces dernières années sont les Extreme Learning Machines (ELM) [75], dérivés des random vector functional link [121]. Ces réseaux sont particulièrement intéressants, car ils sont très facilement et rapidement entraînables, grâce à leur unique couche de neurones dont les poids sont fixes et aléatoires.

Application à la prédiction de la glycémie

Dans le domaine de la prédiction de la glycémie future de personnes diabétiques, les réseaux de neurones artificiels sont sans doute la classe de modèle la plus utilisée ces dernières années. Les premières approches étudiées ont été les réseaux standards de type passe en avant. Ceux-ci ont montré des résultats prometteurs, notamment en comparaison avec les processus autorégressifs grâce à leur prise de décision non linéaire [125, 122, 164]. Ces résultats sont contrastés par les travaux de Georga et al. [60], de Zarkogianni et al. [163], ainsi que de Mayo et al. [111] montrant des performances plus faibles que d’autres modèles comme le modèle SVR notamment. Toutefois, des variantes des réseaux de neurones standards continuent d’être étudiées pour la prédiction de la glycémie [166, 4, 5].

Les réseaux de neurones récurrents dans leur forme classique n’ont pas été grandement utilisés dans le do-maine. Nous pouvons retenir les travaux de Daskalaki et al. [24] ainsi que Jankovic et al. [77] plaidant en faveur d’une approche ensembliste, combinant les réseaux récurrents à d’autres modèles (e.g., ARX, ELM). Quant à eux, les réseaux récurrents de type LSTM ont eu plus de succès. Diverses études ont montré que les modèles LSTM sont plus performants que des modèles autorégressifs [5], ou SVR utilisant des descripteurs physiologiques experts [114, 143], et qu’ils profitent de l’usage de signaux bruts divers comme la fréquence cardiaque ou la conductivité de la peau [110, 115]. Toutefois, ces résultats prometteurs ne se retrouvent pas dans toutes les études [53, 113].

De leur côté, grâce à leur grande rapidité d’entraînement et simplicité, l’utilisation des modèles ELM a été explorée dans le cadre de modèles prédictifs ensemblistes [77] ou bien de modèles en ligne [61]. Récemment,

différentes architectures utilisant des CNN sont expérimentées, notamment en tant qu’extracteur de caractéristiques pour un réseau LSTM [95], ou comme architecture bout-en-bout implémentant des convolutions causales et dilatées [168, 96]. Enfin, il existe un grand nombre de variantes différentes de réseaux de neurones dont certaines comme les modèles alliant réseaux de neurones et logique floue [163], les cartes auto adaptatives, Self-Organizing Maps (SOM) [163], ou les Echo State Networks (ESN) [97].

2.3.5 Autres modèles

Mis à part les processus autorégressifs, les arbres de décision, les modèles utilisant l’astuce du noyau, ou les réseaux de neurones, d’autres algorithmes et modèles ont été étudiés pour la prédiction de la glycémie :

Filtres récursifs : Certains filtres récursifs peuvent être utilisés pour faire de la prédiction dans le temps.

Ces filtres, comme celui par moyenne mobile (équivalent à un processus MA) [126], par lissage exponentiel, Exponential Smoothing (ES) [126], ou par filtre de Kalman, Kalman Filter (KF) [154, 53], ont vu quelques utilisations pour la tâche de la prédiction de la glycémie.

Régression linéaire, Linear Regression (LR) : Des modèles de régression linéaire simple (avec ou sans

régularisation), comparables aux modèles autorégressifs sont parfois utilisés comme modèle de référence [126, 163, 111].

Régression par Variables Latentes à données eXogènes (LVX) : Proposés par Zhao et al. pour la prédiction

de la glycémie, les modèles LVX ont été utilisées plusieurs fois pour la prédiction de la glycémie [99, 53, 95, 96]. Ces modèles sont des régressions linéaires faites non pas sur les variables d’entrées, mais sur des représentations cachées de celles-ci.

Modèles physiologiques (Phys) : Certains chercheurs ont construit des modèles purement mathématiques

décrivant la régulation de la glycémie [142, 99]. Bien que très rarement utilisés à eux seuls pour la prédiction de la glycémie, car assez peu performants [119, 14], ces efforts de modélisation physiologique se retrouvent dans de nombreux descripteurs donnés en entrée aux modèles prédictifs de glycémie [14, 59, 164].

Grammatical Evolution (GE) : Contreras et al. ont grandement étudié l’utilisation d’algorithmes génétiques à

base de grammaire pour la prédiction de la glycémie [21, 20, 150].

Modèles ensemblistes : Plusieurs travaux se tournent vers une approche ensembliste, combinant plusieurs

modèles différents et tentant de tirer parti des forces de chacun [77, 160, 10].

Modèle de référence naïf (Ref) : Certaines études utilisent un modèle naïf, prédisant une valeur de glycémie

égale à la dernière valeur de glycémie connue, comme modèle de référence [14, 110, 114, 115, 126]. Un modèle possédant une précision inférieure à celui-ci est jugé inutile.

2.4 Évaluation des modèles prédictifs de glycémies

Dans cette section, nous passons en revue la méthodologie générale d’évaluation des modèles prédictifs, ainsi que les variabilités présentes au sein des différentes recherches. Puis, nous détaillons les métriques statistiques et cliniques d’évaluation des performances les plus utilisées dans la littérature.

2.4.1 Méthodologie générale

L’objectif des modèles étudiés est de prédire la valeur de la glycémie des personnes diabétiques PH minutes dans le futur. PH représente l’horizon de prédiction et varie de 15 minutes à plusieurs heures. La Figure 2.4 donne un aperçu de la distribution des horizons de prédiction sur les études. Nous pouvons y voir que les horizons de prédictions courts et moyens termes de 30 et 60 minutes sont les plus représentés avec respectivement 86% et 58% des études. Au sein des horizons plus courts, seul l’horizon de 15 minutes semble présenter un intérêt pour la communauté. En effet, en comparaison avec les horizons proches (e.g., 10 ou 20 minutes), celui de 15 minutes fonctionne avec la plupart des capteurs de glycémie en continu, ayant une fréquence d’échantillonnage de 5 ou 15 minutes. Quant aux horizons plus longs-termes, ils sont globalement assez peu représentés (celui de 120 minutes l’étant le plus). Cela s’explique par la grande difficulté de prédiction à des horizons lointains. En effet, plus l’horizon est grand, plus il y a des chances qu’un évènement important pour la régulation de la glycémie (repas, prise d’insuline, sport) survienne sous qu’il puisse être anticipé par le modèle.

Pour tenir compte de la grande inter/intra variabilité de la population diabétique, la plupart des études (76%) évaluent des modèles prédictifs qui ont été personnalisés aux patients diabétiques. À l’exception des travaux de Zhu et al. [168, 169], tous les modèles évalués sur un patient ont été entraînés exclusivement avec les données de ce même patient. Les résultats reportés dans les études sont moyennés sur l’ensemble de la population diabétique étudiée. Bien que moins utilisés (24%), les modèles globaux peuvent être intéressants lorsqu’il n’y a pas assez de données individuelles à disposition [5, 116, 122] ou dans le cadre de l’apprentissage par transfert [169, 115, 143].

Pour permettre une analyse des performances des modèles qui soit non biaisée, les modèles doivent être évalués sur des données qui n’ont pas été utilisées pendant l’entraînement. Ces données portent le nom de jeu de test, en opposition au jeu d’entraînement utilisé pour l’entraînement des modèles. Pour les modèles globaux, les études reportent utiliser des patients de test. Pour les modèles personnalisés, les jeux de tests sont constitués des derniers jours (nombre variable) du patient en question. Contrairement à beaucoup de tâches d’apprentissage automatique, l’évaluation de séries temporelles interdit l’usage de la validation croisée. Consistant en la permutation des jours de test et d’entraînement, elle implique l’évaluation des modèles sur des données du passé pour lesquelles les données d’entraînement donnent des informations. Toutefois, quelques études mentionnent l’utilisation d’un jeu de validation [110, 114, 115, 130, 168, 169]. Celui-ci est une fraction du jeu d’entraînement non utilisé pendant l’entraînement et sert d’évaluation intermédiaire pour optimiser les paramètres des modèles. Ces études reportent

5 10 15 20 25 30 45 60 75 90 120 180 240 300

0

10

20

30

40

Horizon de pr´ediction [min]

Nom

bre

d’

´etud

es