Journées R&D de Météo-France
Utilisation de l’IA pour
remplacer tout ou partie des modèles atmosphériques
Aurélien RIBES Antoine DOURY Blanka BALOGH
(CNRM/GMGEC/AMACS)
Journées R&D de Météo-France
Apprentissage statistique pour la physique d’ARPEGE
Blanka BALOGH
Projet de fin d’études
Encadrants : D. Saint-Martin, A. Ribes CNRM/GMGEC/AMACS
D’ARPEGE-Climat…
ARPEGE-Climat : Modèle de Circulation Générale (GCM) numérique
~150 km
= résolution horizontale d’ARPEGE-Climat
Source : Caltech Exemple de maille d’un modèle atmosphérique.
Certains processus (convection, turbulence…) ne peuvent pas être vus par la maille.
D’ARPEGE-Climat…
ARPEGE-Climat : Modèle de Circulation Générale (GCM) numérique
~150 km
= résolution horizontale d’ARPEGE-Climat
Source : Caltech Exemple de maille d’un modèle atmosphérique.
Certains processus (convection, turbulence…) ne peuvent pas être vus par la maille.
Leur effet moyen à l’échelle de la maille est décrit par les paramétrisations physiques.
Limitations des paramétrisations
X
Données en entrée
Physique
=
Φ Y
Tendances Paramétrisations physiques
d’ARPEGE-Climat
… A la paramétrisation physique…
Dynamique Physique
… Et à l’intelligence artificielle. (1)
Φ
Φ paramétrisation physique apprise
X
Données en entrée
Y
Tendances
Objectif niveau 1
^
^
… Et à l’intelligence artificielle. (2)
Φ HR
ΦHR physique modèle haute résolution apprise
X
Données en entrée
Y
Tendances
Objectif niveau 2
^
^
Données pour l’apprentissage X
X =
Profil T Profil RH Profil u Ps, albédo…
27 colonnes 27 colonnes 27 colonnes 11 colonnes
92 colonnes
i = 0 i = 1
…
i = 3808 i = 3809
…
i = N
N ~ 10
7z z z
Echantillons apprentissage / validation
= X train
= X test
3/4 N
1/4 N
Variable cible Y
Y =
Profil dT Profil dq
27 colonnes 27 colonnes
z z
N ~ 10
754 colonnes
Echantillons apprentissage / validation
= Y train
= Y test
3/4 N
1/4 N
Estimation de Φ
Φ : estimée grâce à des algorithmes de machine learning.
Littérature rare et très récente sur des problèmes plus simples que le nôtre
(Aquaplanet sur bande tropicale — apprentissage d’UNE paramétrisation physique spécifique)
Random Forest : O’Gorman & Dwyer (2018)
Réseau de neurones Multilayer Perceptron : Gentine & al. (2018), Rasp & al. (2018), Brenowitz & Bretherton (2018, 2019)
Implémentation de couches LSTM (« Long Short Term Memory »)
Source : Colah’s blog
Premiers résultats
LSTM : coupe méridienne de tendances d’humidité et de température
Paramétrisation physique
(à apprendre) Réseau de neurones
Niveau verticalNiveau vertical
Latitude
Latitude Latitude
Latitude
dTphys
dqphys
Niveau verticalNiveau vertical
Conclusion & pistes d’amélioration
• Utilisation de couches LSTM adaptée à notre jeu de données.
• Résultats très encourageants (convection semble être bien vue)
• Meilleure apprentissage des tendances d’humidité
Conclusion & pistes d’amélioration
• Implémentation dans ARPEGE-Climat : en cours
Tester la stabilité du réseau de neurones online ?
• Niveau 2 : apprendre la physique d’ARPEGE-NH global à 2.5 km
Perspectives
Sujet de FCPLR proposé pour la rentrée 2019
• Utilisation de couches LSTM adaptée à notre jeu de données.
• Résultats très encourageants (convection semble être bien vue)
• Meilleure apprentissage des tendances d’humidité
ÉMULATION D’UN MODÈLE DE CLIMAT RÉGIONAL
Antoine DOURY
Stagiaire au CNRM/GMGEC/MOSCA ,
Encadrants : Samuel SOMOT, Aurélien RIBES
Journées R&D - I.A.
Page 2
Etude du changement climatique
■ Global Climate Model (ex : ARPEGE, résolution : 1,4° ≈ 150km)
■ Regional Climate Model :
► Aire Limitée
► Forcé aux bords par un GCM
► HAUTE résolution
► ex: ALADIN,résolution : 0,11° ≈ 12km
Journées R&D - I.A.
Page 3
Etude du changement climatique
■ Global Climate Model (ex : ARPEGE, résolution : 1,4° ≈ 150km)
■ Regional Climate Model :
► Aire Limitée
► Forcé aux bords par un GCM
► HAUTE résolution
► ex: ALADIN,résolution : 0,11° ≈ 12km
150 km
Relief et trait de côte pour la France
12 km
Journées R&D - I.A.
Page 4
Etude du changement climatique
■ Global Climate Model (ex : ARPEGE, résolution : 1,4° ≈ 150km)
■ Regional Climate Model :
► Aire Limitée
► Forcé aux bords par un GCM
► HAUTE résolution
► ex: ALADIN,résolution : 0,11° ≈ 12km
■ Différentes sources d’incertitudes :
► Scénarios d’émissions anthropiques
► Choix des modèles GCM-RCM
► Variabilité interne des modèles
Compléter une matrice en 4 dimensions : SCENARIO x GCM x RCM x MEMBRE
Journées R&D - I.A.
Page 5
Définition du problème
Y = f ( X )
X : Sorties du GCM
Plusieurs variables 20 variables
En chaque point de grille du GCM 128*256 = 32 768 pts
A plusieurs niveaux de pression 8 niveaux : 1000 hPa à 10hPa
Au pas de temps du GCM quotidien sur 150 ans (54750 j)
20 * 32768 * 8 = 5 242 880 ‘variables’ pour 54 750 ‘observations/réalisations’ Y : Sorties du RCM , de dimension similaire :
Plus grande résolution, donc plus de points de grille 453*453 = 205 209 pts
Journées R&D - I.A.
Page 6
Objectif : Émuler le RCM
■ Estimer la fonction f à l’aide de méthodes d’apprentissage statistique
■ Peu de littérature sur le sujet : Downscaling statistique
► Y : les données de stations (obs)
► X : souvent issu de réanalyses
■ Pour ce stage : Réduction de la taille de Y
► Focus sur la ville de Montpellier et sur la température de surface
■ Données : 1 run historique de CNRM-ALADIN63 12 km, 1951- 2005 forcé par CNRM CM5.
■ Séparation train/test : 1990 (40 ans d’apprentissage, et 15 ans de validation)
Journées R&D - I.A.
Page 7
Illustration
Journées R&D - I.A.
Page 8
Première Méthode
■ X univarié : la série temporelle de la variable TAS au point de grille de Montpellier dans le GCM
■ CDFt : méthode de correction de biais/ downscaling statistique
(Vrac et al. 2009)
Journées R&D - I.A.
Page 9
Deuxième méthode : Random Forest
■ X multivarié :
― Variables de surface issues du GCM : TAS, PR, SFCWIND
― Variables atmosphériques issues du GCM:
Géopotentiel, Humidité, Vent, Température
— ACP réalisée sur un domaine 3D pour chaque variable:
» 8 niveaux de pression de 1000hPa à 10hPa
» Une boite autour de Montpellier de 750km*750km
» On garde environ 15 composantes par variable
― Cosinus/Sinus pour contrôler la saisonnalité.
► Xi vecteur de taille 65
cos(2π∗d/365)
Journées R&D - I.A.
Page 10
Deuxième méthode : Random Forest
Journées R&D - I.A.
Page 11
Deuxième méthode : Random Forest
Journées R&D - I.A.
Page 12
Résultats
Journées R&D - I.A.
Page 13
Perspectives
■ Nouvelles méthodes :
► Autres méthodes de downscaling
► Deep Learning : Réseaux convolutifs et/ou récurrents
■ Utiliser des runs de climat futur avec scénarios
■ Émuler la grille entière et toutes les variables.