• Aucun résultat trouvé

Descente d’échelle statistique par type de temps et analogues avec DSCLIM sur le printemps en France métropolitaine

La descente d’échelle des prévisions saisonnières

6.2 Descente d’échelle statistique par type de temps et analogues avec DSCLIM sur le printemps en France métropolitaine

6.2 Descente d’échelle statistique par type de temps et analogues

avec DSCLIM sur le printemps en France métropolitaine

 Description

Ici, nous allons brièvement présenter la descente d’échelle par type de temps et analogues utilisée dans cette thèse grâce au logiciel développé par le CERFACS : DSCLIM (pour plus de détails de cette méthode, le lecteur peut se référer au document technique : Pagé et al.[2010] disponible sur internet via : http://www.cerfacs.fr/~page/dsclim/dsclim_doc-latest.pdf, mais aussi à Boé [2007]).

Sur la FIG. 6.1, un schéma résumant la méthodologie de DSCLIM est présenté.

Comme nous l’avons précédemment dit dans la section 6.1.3., une longue série de données homogènes est nécessaire. Ici la méthode s’appuyant sur des données journalières, la base de données est donc constituée de variables disponibles au pas de temps journalier. De plus, cette méthode est réalisée pour chaque saison de l’année séparément.

La méthodologie est séparée en deux phases : une phase d’apprentissage et une phase de descente d’échelle.

FIG. 6.1. Schéma décrivant la descente d’échelle statistique de types de temps/analogues décrite dans Pagé et al. [2010]

La phase d’apprentissage est réalisée sur une période passée (de préférence de 25 ans minimum) au pas de temps journalier avec les MSLP (pressions au niveau de la mer) et les températures à 2 mètres (T2m) comme variables de grande échelle, et les précipitations totales comme variable régionale/locale.

Les anomalies de MSLP (MSLP désaisonnalisées et retranchées par la climatologie calendaire des champs), provenant des réanalyses journalières NCEP [Saha et al., 2010], sont lissées par un filtre de Hanning sur une fenêtre de 60 jours. Les champs de MSLP sont ensuite transformés par une Analyse en Composantes Principales sur le domaine défini par Boé [2007] et présenté sur la FIG. 6.2. Cette opération est également réalisée sur les précipitations totales (Ptot) quotidiennes, issues des réanalyses SAFRAN [Vidal et al., 2010a]. Les 10 premières composantes principales (CP) des MSLP et des Ptot forment ainsi un espace à 20 dimensions, dans lequel les jours de l’archive sont classés en différents types de temps par l’algorithme du k-means (le nombre de classes étant déterminé a priori). Les types de temps et leurs centres de gravité (correspondant au champ moyen de MSLP) sont alors déterminés. De plus, chaque jour de la période d’apprentissage est repéré par les distances euclidiennes entre le champ de MSLP du jour et les champs moyens des différents centroïdes. Une fois les distances euclidiennes calculées, la distance à tous les types de temps pour chaque jour est ensuite déterminé. Parallèlement, les T2m sont moyennées sur la région étudiée.

Les distances aux types de temps pour chaque jour, sont ensuite utilisées dans une équation de régression avec les précipitations locales, pour calculer les coefficients de régression qui seront alors utilisées dans la phase de désagrégation. La régression permet ainsi de reproduire à la fois la variabilité des précipitations entres les différentes classes et la variabilité intra-type.

La phase de désagrégation (ou reconstruction) consiste alors à utiliser les MSLP et T2m simulés par un modèle de climat sur la même région que celle utilisée lors de la phase d’apprentissage, soit sur une période de contrôle, soit sur une période future.

Pour chaque jour désagrégé, la température est moyennée sur la région, et l’anomalie de MSLP est utilisée pour calculer le type de temps et les distances aux types de temps déterminés lors de la phase d’apprentissage. Le jour désagrégé appartient alors au type de temps dont le centroïde est le plus proche. Les coefficients de régression précédemment calculés pendant la phase d’apprentissage sont ensuite utilisés pour reconstruire les Ptot. Les Ptot reconstruites (avec les T2m moyennes sur la région) sont alors utilisées pour chercher le jour analogue en les comparant à chaque jour de la phase d’apprentissage. De plus, une correction de la température est réalisée : quand la différence de température absolue est plus grande que 2°C entre les T2m moyennes du modèle climatique et la température issue des réanalyses du jour analogue, le jour analogue est corrigé par la différence de température.

Enfin, un jour est aléatoirement choisi par les plus proches analogues, et toutes les variables météorologiques (par exemple, ceux qui sont nécessaires à l’entrée d’ISBA : vent, pression, humidité et rayonnements) du jour retenu sont ainsi utilisées comme scénario météorologique pour le jour désagrégé. Ce choix introduit donc un second processus stochastique dans DSCLIM, même si la recherche d’analogues est restreinte à une période de l’année de plus ou moins 10 jours autour du jour étudié pour ainsi assurer la cohérence physique de variables très influencées par la saison (rayonnement).

Enfin, le partage de entre la pluie et la neige est réalisé suivant un seuil de température de 1.5 °C (cf. étude réalisée dans sect. 5.3.2.).

 Validation et choix de certains paramètres

La validation de cette méthode a été réalisée dans Boé et al [2006], Boé [2007], Boé and Terray [2008a,b] en France sur le bassin de la Seine, puis sur l’ensemble du territoire dans le

ainsi été évalué sur la période 1970-2005.

Boé [2007] a calculé des corrélations entre les précipitations quotidiennes reconstruites et observées sur la France sur cette période. Elles sont en moyenne de 0.33 sur tout le pays, avec de meilleurs scores dans le Nord et l’Ouest de la France en hiver, et des scores qui se dégradent au contraire en été sur le pourtour méditerranéen.

Ces résultats sont obtenus avec certains choix sur : la variable de grande échelle, le domaine spatial de classification pour cette variable de grande échelle, le domaine spatial de classification pour les précipitations, le nombre de classes et la définition des saisons.

A l’époque, Boé [2007] avait retenue la variable du MSLP essentiellement pour une question de disponibilité dans les modèles de climat utilisés. Dans cette thèse, nous avons choisi de garder dans un premier temps cette variable de grande échelle.

Plusieurs domaines de classification de la variable de grande échelle ont été testés. Un domaine trop élargi dégrade la performance de DSCLIM [Boé, 2007]. Le domaine sur la FIG. 6.2 a ainsi été choisi, et c’est celui que nous conserverons lors de cette étude.

Pour les précipitations, l’ensemble de la France a été prise en compte, mais il est possible d’utiliser d’autres domaines différents adaptés à la région étudiée. Notre étude conservera l’ensemble de la France métropolitaine puisqu’il s’agit de la région étudiée.

Le nombre de classes a été traité de manière approfondie par Christiansen [2007]. Boé [2007] utilise entre 9 et 10 classes par saison. Par défaut, nous les conserverons.

Enfin, les saisons définies comme les saisons standards (DJF, MAM, JJA, SON) conviennent parfaitement dans le cadre de la prévision saisonnière, sachant qu’ici la saison étudiée est celle de MAM.

FIG. 6.2. Domaine géographique de grande échelle servant à la classification des types de temps [Boé, 2007]

 Adaptation à la prévision saisonnière hydrologique pour le printemps avec le modèle ARPEGE-ENSEMBLES

Dans la FIG. 6.3., nous pouvons voir le schéma présentant la méthodologie DSCLIM adaptée à la prévision saisonnière dans cette thèse.

La méthodologie reste la même que l’originale présentée dans la FIG. 6.1, par contre pour la phase de désagrégation/reconstruction, on utilise les MSLP et T2m du modèle ARPEGE-ENSEMBLES préalablement utilisé pour l’étude de prévisibilité en France (cf. chapitre 5 et Singla et al. [2012]). La période de reconstruction/désagrégation est ainsi réalisée sur l’entière période de disponibilité du jeu de données de prévisions passées : 1960-2005. Ce sont donc les simulations saisonnières des MSLP et les T2m qui sont utilisées pour la désagrégation proprement dite sur la saison du printemps seulement (MAM). Aussi, le modèle de climat possédant 9 membres, la méthode DSCLIM est alors appliquée pour chaque membre de prévision.

FIG. 6.3. Schéma décrivant DSCLIM appliqué dans cette thèse pour la prévision saisonnière pour la saison du printemps uniquement pour chaque membre

6.3 Impact de DSCLIM sur les prévisions saisonnières