Utilisation de l’IA pour remplacer tout ou partie des modèles atmosphériques

(1)

Journées R&D de Météo-France

Utilisation de l’IA pour

remplacer tout ou partie des modèles atmosphériques

Aurélien RIBES Antoine DOURY Blanka BALOGH

(CNRM/GMGEC/AMACS)

(2)

Journées R&D de Météo-France

Apprentissage statistique pour la physique d’ARPEGE

Blanka BALOGH

Projet de fin d’études

Encadrants : D. Saint-Martin, A. Ribes CNRM/GMGEC/AMACS

(3)

D’ARPEGE-Climat…

ARPEGE-Climat : Modèle de Circulation Générale (GCM) numérique

~150 km

= résolution horizontale d’ARPEGE-Climat

Source : Caltech Exemple de maille d’un modèle atmosphérique.

Certains processus (convection, turbulence…) ne peuvent pas être vus par la maille.

(4)

D’ARPEGE-Climat…

ARPEGE-Climat : Modèle de Circulation Générale (GCM) numérique

~150 km

= résolution horizontale d’ARPEGE-Climat

Source : Caltech Exemple de maille d’un modèle atmosphérique.

Certains processus (convection, turbulence…) ne peuvent pas être vus par la maille.

Leur effet moyen à l’échelle de la maille est décrit par les paramétrisations physiques.

Limitations des paramétrisations

(5)

X

Données en entrée

Physique

=

Φ Y

Tendances Paramétrisations physiques

d’ARPEGE-Climat

… A la paramétrisation physique…

Dynamique Physique

(6)

… Et à l’intelligence artificielle. (1)

Φ

Φ paramétrisation physique apprise

X

Données en entrée

Y

Tendances

Objectif niveau 1

^

(7)

… Et à l’intelligence artificielle. (2)

Φ HR

ΦHR physique modèle haute résolution apprise

X

Données en entrée

Y

Tendances

Objectif niveau 2

^

(8)

Données pour l’apprentissage X

X =

Profil T Profil RH Profil u Ps, albédo…

27 colonnes 27 colonnes 27 colonnes 11 colonnes

92 colonnes

i = 0 i = 1

…

i = 3808 i = 3809

…

i = N

N ~ 10

⁷

z z z

(9)

Echantillons apprentissage / validation

= X train

= X test

3/4 N

1/4 N

(10)

Variable cible Y

Y =

Profil dT Profil dq

27 colonnes 27 colonnes

z z

N ~ 10

⁷

54 colonnes

(11)

Echantillons apprentissage / validation

= Y train

= Y test

3/4 N

1/4 N

(12)

Estimation de Φ

Φ : estimée grâce à des algorithmes de machine learning.

Littérature rare et très récente sur des problèmes plus simples que le nôtre

(Aquaplanet sur bande tropicale — apprentissage d’UNE paramétrisation physique spécifique)

Random Forest : O’Gorman & Dwyer (2018)

Réseau de neurones Multilayer Perceptron : Gentine & al. (2018), Rasp & al. (2018), Brenowitz & Bretherton (2018, 2019)

Implémentation de couches LSTM (« Long Short Term Memory »)

Source : Colah’s blog

(13)

Premiers résultats

LSTM : coupe méridienne de tendances d’humidité et de température

Paramétrisation physique

(à apprendre) Réseau de neurones

Niveau verticalNiveau vertical

Latitude

Latitude Latitude

Latitude

dTphys

dqphys

Niveau verticalNiveau vertical

(14)

Conclusion & pistes d’amélioration

• Utilisation de couches LSTM adaptée à notre jeu de données.

• Résultats très encourageants (convection semble être bien vue)

• Meilleure apprentissage des tendances d’humidité

(15)

Conclusion & pistes d’amélioration

• Implémentation dans ARPEGE-Climat : en cours

Tester la stabilité du réseau de neurones online ?

• Niveau 2 : apprendre la physique d’ARPEGE-NH global à 2.5 km

Perspectives

Sujet de FCPLR proposé pour la rentrée 2019

• Utilisation de couches LSTM adaptée à notre jeu de données.

• Résultats très encourageants (convection semble être bien vue)

• Meilleure apprentissage des tendances d’humidité

(16)

ÉMULATION D’UN MODÈLE DE CLIMAT RÉGIONAL

Antoine DOURY

Stagiaire au CNRM/GMGEC/MOSCA ,

Encadrants : Samuel SOMOT, Aurélien RIBES

(17)

Journées R&D - I.A.

Page 2

Etude du changement climatique

■ Global Climate Model (ex : ARPEGE, résolution : 1,4° ≈ 150km)

■ Regional Climate Model :

► Aire Limitée

► Forcé aux bords par un GCM

► HAUTE résolution

► ex: ALADIN,résolution : 0,11° ≈ 12km

(18)

Page 3

Etude du changement climatique

150 km

Relief et trait de côte pour la France

12 km

(19)

Page 4

Etude du changement climatique

■ Différentes sources d’incertitudes :

► Scénarios d’émissions anthropiques

► Choix des modèles GCM-RCM

► Variabilité interne des modèles

Compléter une matrice en 4 dimensions : SCENARIO x GCM x RCM x MEMBRE

(20)

Page 5

Définition du problème

Y = f ( X )

 X : Sorties du GCM

 Plusieurs variables 20 variables

 En chaque point de grille du GCM 128*256 = 32 768 pts

 A plusieurs niveaux de pression 8 niveaux : 1000 hPa à 10hPa

 Au pas de temps du GCM quotidien sur 150 ans (54750 j)



20 * 32768 * 8 = 5 242 880 ‘variables’ pour 54 750 ‘observations/réalisations’

 Y : Sorties du RCM , de dimension similaire :

 Plus grande résolution, donc plus de points de grille 453*453 = 205 209 pts

(21)

Page 6

Objectif : Émuler le RCM

■ Estimer la fonction f à l’aide de méthodes d’apprentissage statistique

■ Peu de littérature sur le sujet : Downscaling statistique

► Y : les données de stations (obs)

► X : souvent issu de réanalyses

■ Pour ce stage : Réduction de la taille de Y

► Focus sur la ville de Montpellier et sur la température de surface

■ Données : 1 run historique de CNRM-ALADIN63 12 km, 1951- 2005 forcé par CNRM CM5.

■ Séparation train/test : 1990 (40 ans d’apprentissage, et 15 ans de validation)

(22)

Page 7

Illustration

(23)

Page 8

Première Méthode

■ X univarié : la série temporelle de la variable TAS au point de grille de Montpellier dans le GCM

■ CDFt : méthode de correction de biais/ downscaling statistique

(Vrac et al. 2009)

(24)

Page 9

Deuxième méthode : Random Forest

■ X multivarié :

― Variables de surface issues du GCM : TAS, PR, SFCWIND

― Variables atmosphériques issues du GCM:

Géopotentiel, Humidité, Vent, Température

— ACP réalisée sur un domaine 3D pour chaque variable:

» 8 niveaux de pression de 1000hPa à 10hPa

» Une boite autour de Montpellier de 750km*750km

» On garde environ 15 composantes par variable

― Cosinus/Sinus pour contrôler la saisonnalité.

► X_i vecteur de taille 65

cos(2π∗d/365)

(25)

Page 10

Deuxième méthode : Random Forest

(26)

Page 11

Deuxième méthode : Random Forest

(27)

Page 12

Résultats

(28)

Page 13

Perspectives

■ Nouvelles méthodes :

► Autres méthodes de downscaling

► Deep Learning : Réseaux convolutifs et/ou récurrents

■ Utiliser des runs de climat futur avec scénarios

■ Émuler la grille entière et toutes les variables.