• Aucun résultat trouvé

Exemple d’utilisation de la R-EGA pour estimer la précision clinique des prédictions de glycémie

1

.min

1

] Rate-Error Grid Analysis

FIGURE2.7: Exemple d’utilisation de la R-EGA pour estimer la précision clinique des prédictions de glycémie.

2.5 Synthèse des résultats

Les premiers travaux visant à construire des modèles prédisant la glycémie future de personnes diabétiques se focalisent sur l’utilisation de processus autorégressifs. En 2007, Sparacino et al. montrent qu’un modèle AR de faible ordre est capable de faire des prédictions permettant d’anticiper les hypoglycémies des patients 20 à 25 minutes en avance [140]. Ces résultats sont confirmés sur d’autres patients par Gani et al. [56]. En particulier, ils attribuent cette réussite au lissage du signal de glycémie qui comporte un bruit trop important dans sa forme brute. Toutefois, comme ces derniers le soulèvent, le lissage des prédictions, tel qu’il a été fait dans ces deux études, est incompatible avec une utilisation réelle, en ligne. En effet, ces filtres ne sont pas causals, car ils utilisent les données du futur. Toujours avec des processus autorégressifs, en 2012, les travaux de Zhao et al. et de

Eren-P-EGA

Hypoglycémie Euglycémie Hyperglycémie

A D E A B C A B C D E R-EGA A AP EP EP AP AP EP AP AP EP EP EP B AP EP EP AP AP EP AP AP EP EP EP uC BE EP EP BE BE EP BE BE EP EP EP lC BE EP EP BE BE EP BE BE EP EP EP uD EP EP EP BE BE EP BE BE EP EP EP lD BE EP EP BE BE EP EP EP EP EP EP uE EP EP EP EP EP EP EP EP EP EP EP lE BE EP EP EP EP EP EP EP EP EP EP

AP : Accurate Prediction ; BE : Benign Error ; EP : Erroneous Prediction

Tableau 2.2: Classification des prédictions de glycémie opérée par la CG-EGA. En fonction des scores obtenus sur la P-EGA et la R-EGA, une prédiction est classifiée comme étant une prédiction cliniquement précise (AP), une erreur benigne (BE) ou une erreur dangereuse (EP).

Oruklu et al. suggèrent qu’ajouter des informations supplémentaires comme les prises d’insuline et de glucides [167] ou concernant l’activité physique [45] permet d’améliorer les prédictions.

Suite à ces travaux, de nombreux efforts ont été faits pour identifier les données d’entrées les plus adaptées pour la prédiction de la glycémie :

— L’intérêt de l’ajout d’informations concernant les repas a été confirmé par les travaux de Zecchin et al. utilisant des réseaux de neurones FFNN [164, 166] et de Midroni et al. utilisant des modèles GBM [113]. Dans leurs travaux, Montaser et al. ont étudié le caractère saisonnier des excursions de glycémie postprandiales (i.e., suite à un repas) [116]. Ils montrent en particulier que lorsque les repas sont à heure et quantité de glucides fixes, il est possible de prédire la glycémie du patient à un horizon bien plus lointain (jusqu’à 5h). Bien que les contraintes imposées soient incompatibles avec une utilisation quotidienne d’un tel dispositif, leurs travaux montrent néanmoins l’importance des repas dans la modélisation de la glycémie future des patients.

— Quant à l’ajout d’informations liées à l’activité physique du patient, les résultats sont plus contrastés. Jankovic et al. reportent un gain en performance lié à leur utilisation [77], utilisation qui serait particulièrement bénéfique en région d’hypoglycémie selon les travaux de Zarkogianni et al. [163]. Cependant, en utilisant un modèle GBM permettant d’évaluer l’importance des variables d’entrées pour la prédiction, les travaux de Midroni et al. montrent à la fois que les modèles donnent beaucoup d’importance aux variables décrivant l’activité physique du patient, mais que ces modèles n’arrivent pas à avoir une meilleure précision que les modèles ne les utilisant pas [113]. Enfin, bien que Mirshkarian et al. reportent un gain en performances en utilisant des informations comme la fréquence cardiaque ou la conductivité de la peau sur un modèle LSTM, nous notons que ces améliorations sont faibles [115]. Ainsi, l’intérêt de l’utilisation d’informations décrivant l’activité physique du patient est incertain.

différentes études. Bunescu et al. et Georga et al. montrent qu’un modèle SVR utilisant des descripteurs phy-siologiques modélisant les dynamiques d’insuline et de glucides, ainsi que les dépenses énergétiques des pa-tients est capable d’effectuer de très bonnes prédictions [14, 59]. Toutefois, Mirshekarian et al. montrent qu’un modèle LSTM n’utilisant pas ces connaissances expertes est capable d’obtenir de meilleures performances [114]. En effet, à condition d’utiliser suffisamment de données d’entraînement, les réseaux de neurones ont la capacité d’apprendre à extraire les informations pertinentes à partir des données brutes sans intervention humaine.

Néanmoins, les principaux efforts ont été portés sur la recherche de modèles prédictifs plus performants. Dans cet état de l’art, nous reportons un très grand nombre de modèles prédictifs différents, allant des modèles auto-régressifs historiques, à des modèles plus complexes relevant de l’apprentissage profond. Dans l’ensemble, il est difficile de déterminer lequel des modèles est le plus adapté à la tâche de prédiction de glycémie, chaque étude reportant souvent des conclusions différentes. De plus, il est impossible de comparer les résultats de chaque étude entre eux, car ces dernières utilisent des ensembles de données différents. Toutefois, nous pouvons faire les ana-lyses suivantes :

— Les modèles autorégressifs utilisés historiquement ont montré être surpassés par de nombreux autres mo-dèles caractérisés par leur complexité accrue, en particulier par des SVR [14], réseaux de neurones FFNN [125, 164, 4], réseaux de neurones récurrents [5, 114, 115, 143, 169] ou convolutifs [95, 96].

— La publication du jeu de données OhioT1DM nous permet de comparer les publications l’utilisant pour l’éva-luation de leurs modèles. Sur un total de 12 études, seules 7 peuvent être rigoureusement comparées, car celles-ci utilisent strictement le même ensemble de test ainsi qu’une métrique d’évaluation commune (RMSE). Au sein des modèles présentés, les réseaux de neurones récurrents de Mirshekarian et al. [115] et de [169] montrent avoir la meilleur précision. Ils sont suivis par les modèles GBM de Jeon et al. [78], les réseaux de neurones FFNN de Bertachi et al. [10], et les réseaux de neurones convolutifs de Li et al. [96]. De leur côté, les modèles SVR [96, 169], autorégressifs [96, 169, 115], ou utilisant les modèles d’évolution grammaticale GE [21] ne semblent pas donner de résultats satisfaisants. Globalement ces résultats plaident en faveur de l’apprentissage profond pour la prédiction de la glycémie. Nous notons que ce qui démarque les réseaux de neurones performants des autres moins performants est, outre la nature du modèle, l’utilisation de l’apprentis-sage par transfert. Dans le cadre de l’entraînement d’un modèle personnalisé au patient, l’apprentisl’apprentis-sage par transfert permet de réutiliser les connaissances apprises sur plusieurs patients pour faciliter l’apprentissage du modèle sur un nouveau patient.

— Dans leurs travaux Mayo et al. montrent que les performances relatives des modèles sont très variables en fonction des différentes régions glycémiques (hypoglycémie, euglycémie, hyperglycémie) [111]. Ces régions n’étant pas représentées équitablement au sein des sous-ensembles de test, le meilleur modèle général n’est

pas nécessairement le meilleur modèle dans toutes les régions individuelles. En particulier, dans leur étude, tandis que le modèle SVR est le meilleur dans les régions d’euglycémie ou d’hyperglycémie, c’est le modèle FFNN qui est le plus adapté aux prédictions en hypoglycémie. Ce constat a amené plusieurs chercheurs à explorer des méthodes ensemblistes pour la prédiction de la glycémie. Dans leurs travaux, Vehí et al. proposent de combiner l’utilisation d’un modèle basé sur l’évolution grammaticale GE pour la prédiction à moyen terme de la glycémie, un modèle SVM pour la détection d’hypoglycémie postprandiale, et un réseau de neurones FFNN pour la détection d’hypoglycémie nocturne [150]. Quant à eux, Bertachi et al. proposent d’utiliser plusieurs réseaux FFNN, chacun spécialisé dans une zone région glycémique spécifique [10].

— Certains travaux permettent de soulever la disparité entre les mesures statistiques utilisées dans l’entraîne-ment des modèles prédictifs de glycémie et leurs objectifs cliniques. Dans leurs travaux, plutôt que de prédire la glycémie future des patients, Martinsson et al. proposent d’entraîner les modèles à paramétriser une dis-tribution gaussienne centrée sur la prédiction afin d’estimer l’incertitude de la prédiction [110]. Quant à eux, Vehi et al. proposent d’utiliser une fonction de coût donnant plus d’importance aux régions d’hypoglycémie et d’hyperglycémie [150].

2.6 Analyse critique et perspectives

2.6.1 Analyse des performances relatives des modèles prédictifs

Comme nous venons de le voir dans ce chapitre, l’état de l’art de la prédiction de la glycémie est très fourni. La Figure 2.8, représentant la distribution des études analysées sur les années, nous montre que le domaine de la prédiction de la glycémie suscite de plus en plus d’intérêt. Cela s’explique par la démocratisation du logiciel de simulation T1DMS ces dernières années, avec plus de 70% des publications datant d’après 2017, ainsi que par la mise à disposition du jeu de données OhioT1DM en 2018. Ceux-ci permettent notamment à des chercheurs extérieurs au domaine de participer aux efforts bien plus facilement que s’ils devaient récolter eux-mêmes les données. Du point de vue de cette thèse, nous notons que la plupart des études analysées dans l’état de l’art, tout comme le jeu de données OhioT1DM, n’existaient pas lors de son commencement en octobre 2017.

Cependant, il est aujourd’hui difficile d’évaluer l’état de la littérature, d’identifier les meilleurs modèles, données ou étapes de prétraitement. En effet, aujourd’hui, les études traitant de la prédiction de la glycémie sont grandement hétérogènes :

— Tout d’abord, bien que cela est en train de changer avec le jeu de données OhioT1DM, très peu d’études utilisent les mêmes données, rendant les comparaisons entre études délicates, voire impossibles. De plus, en étant utilisées en petites quantités (faible nombre de patients, petites quantités de données par patient), les résultats ne peuvent refléter l’intégralité de la population diabétique caractérisée par sa grande variabilité.

2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020

0

2

4

6

8

10

12

1

0

4

1 1

4 4

2 2

3

6

11

6

5

Année

Nom

bre

d’études