• Aucun résultat trouvé

4.4 Les impacts de l’ENSO et de la MJO sur les fortes précipitations sont-ils cor-

4.5.1 Aperçu des approches mathématiques existantes

De nombreux travaux se sont attachés à proposer des approches mathématiques pour la prévision statistico-dynamique, qu’il s’agisse de calibration et/ou de bridging (voir Section

1.4.3), ou même de descente d’échelle statistique (lorsque l’enjeu est de fournir des prévisions

à résolution plus fine plutôt que d’améliorer les prévisions existantes à résolution constante). Ces approches statistiques sont particulièrement répandues en prévision saisonnière, puisque celle-ci fut initialement développée sous forme d’un bridging à partir les anomalies de TSO liées à l’ENSO, avant même que ne soient utilisés des modèles dynamiques (Barnett, 1981; Barnston et Smith, 1996; Cohen et al., 2019). Elles sont aussi très courantes en prévision numérique du temps à court terme, en particulier lorsqu’il s’agit de prévision d’ensemble (Taillardat, 2017), car la calibration y est nécessaire en vue d’applications opérationnelles. Les grandes familles de méthodes sont présentées ci-dessous.

◦ Méthodes linéaires

Les méthodes linéaires expriment les précipitations comme combinaisons linéaires des pré- dicteurs choisis. Cela peut aller de la régression linéaire mono- ou multi-variée (Wilby, 1998) à l’exploitation de la covariance de plusieurs champs de variables avec le champ de précipi- tations par décomposition en valeurs singulières ou par analyse canonique des corrélations (Bretherton et al., 1992; Feddersen et al., 1999; Lim et al., 2011). En prévision numérique du temps, on utilise couramment la méthode de calibration d’ensemble EMOS/NR (Ensemble Model Output Statistics / Non-homogeneous Regression, Gneiting et al., 2005) qui est aussi une méthode linéaire.

4.5 Développement et évaluation d’une approche statistico-dynamique bayésienne Dans la continuité des méthodes linéaires, il est possible d’utiliser des modèles linéaires généralisés. Leur usage sera plus pertinent qu’une régression linéaire si le prédictand ne suit pas une distribution gaussienne, ce qui est le cas des précipitations (voir par exemple Manzanas et al., 2015). Dans ce cas, les précipitations sont déduites en appliquant une fonction de lien (non linéaire) à une combinaison linéaire des prédicteurs. La régression logistique, utilisée en prévision S2S par Doss-Gollin et al. (2018), est un exemple de modèle linéaire généralisé qui permet de prévoir la probabilité d’un événement binaire.

◦ Méthodes bayésiennes

À partir de la formule de Bayes, les méthodes bayésiennes expriment la distribution des précipitations conditionnée à la valeur des prédicteurs. Cela requiert d’établir une expression de la vraisemblance, c’est-à-dire la distribution jointe des prédicteurs conditionnée à la valeur des précipitations, et d’avoir une hypothèse sur la distribution des précipitations a priori. Parmi ces méthodes, la BMA (Bayesian Model Averaging, Raftery et al., 2005) est fréquem- ment utilisée pour calibrer la prévision numérique du temps à court terme. Aux échéances saisonnières, Wang et al. (2009) ont proposé la BJP (Bayesian Joint Probability), qui a été utilisée à de nombreuses reprises sous différentes variantes pour la prévision des températures (Schepen et al., 2016; Wang et al., 2019) et des précipitations (Schepen et al., 2012, 2014, 2018) en Australie. Une approche bayésienne de descente d’échelle des prévisions saisonnières de précipitations sur l’Amérique du Sud a également été proposée par Coelho et al. (2006).

◦ Générateurs aléatoires de temps

Ces méthodes reposent sur la génération aléatoire de données de précipitations, contrainte par les informations des prédicteurs. En effectuant un grand nombre de tirages, on reconstruit une distribution réaliste des précipitations. Ce type de méthode est proposé par Robertson et al. (2004a) avec des modèles de Markov cachés pour la prévision saisonnière de précipitations au Brésil.

◦ Méthodes par analogues

Dans les méthodes par analogues, on identifie des situations climatiques passées similaires à la situation en temps réel (les analogues), et on réutilise les champs de précipitations ob- servés qui leur correspondent. En prenant un nombre adéquat d’analogues, on parvient à une distribution des précipitations présentant les caractéristiques souhaitées. Une telle approche a été implémentée en prévision saisonnière par Clark et Déqué (2003), Díez et al. (2005), Wu et al. (2012) ou encore Manzanas (2017). En prévision infra-saisonnière, la démarche proposée par Lledó et Doblas-Reyes (2020), qui suggère de prévoir une distribution du vent en Eu- rope conditionnellement à la phase MJO prévue, peut aussi être assimilée à une méthode par analogues.

◦ Méthodes d’apprentissage machine

Les méthodes d’apprentissage machine (arbres de régression, forêts aléatoires, réseaux de neurones pour les plus connues) sont capables de représenter les relations non-linéaires entre prédicteurs et prédictand. Cela peut s’avérer particulièrement utile dans le cas des précipi- tations, étant donné la non-linéarité des phénomènes mis en jeu. En prévision numérique du temps, des méthodes de calibration des prévisions d’ensemble de précipitations reposant sur

La prévision infra-saisonnière statistico-dynamique

des forêts aléatoires (Quantile Regression Forest et Gradient Forest) ont ainsi été exploitées par Taillardat et al. (2019). En prévision saisonnière, Zorita et von Storch (1999) ont utilisé des réseaux de neurones pour la prévision de précipitations sur la péninsule ibérique, tan- dis que Leroy (2006) a également eu recours à cette méthode pour la descente d’échelle des températures et des précipitations en Nouvelle-Calédonie.

Les méthodes d’apprentissage machine suscitent depuis quelques années l’intérêt de nom- breuses communautés scientifiques, et on constate leur émergence pour des problématiques de prévision climatique infra-saisonnière à saisonnière. Par rapport aux autres méthodes décrites ci-dessus, elles sont encore peu utilisées directement sur les données des systèmes de prévision numérique de type S2S ou saisonnier car elles nécessitent souvent de grands échantillons d’ap- prentissage. Toutefois, au-delà de leur application à des sorties de modèles numériques, des travaux proposent de les mettre en œuvre pour produire des prévisions purement statistiques à quelques semaines ou quelques mois d’échéance à partir des seules observations disponibles. Par exemple, Ham et al. (2019) présentent une approche de deep learning reposant sur l’ap- prentissage des données de la base CMIP5 qui permet de prévoir l’indice Niño 3.4 jusqu’à 17 mois d’échéance. Dans la fenêtre infra-saisonnière, Cohen et al. (2019) promeuvent une plus grande utilisation de méthodes d’apprentissage machine dont certaines (MultiLLR, Au- toKNN) sont ensuite utilisées par Hwang et al. (2019) pour prévoir les températures et les précipitations aux États-Unis sur des fenêtres de deux semaines (semaines 3-4, semaines 5-6). Au cours de ces travaux de thèse, plusieurs de ces approches mathématiques ont été envisa- gées et testées dans le but de produire des prévisions infra-saisonnières statistico-dynamiques. Les améliorations de scores les plus importantes et les plus robustes ont été obtenues avec la méthode bayésienne présentée dans l’article qui suit. Le reste du chapitre lui est consacré.