• Aucun résultat trouvé

2.2 Evaluation des prévisions

2.2.1 A quoi compare-t-on les prévisions ?

2.2.1.1 Observations in-situ et données satellitaires

L’atmosphère, l’océan et les surfaces continentales font l’objet de nombreuses attentions de la part de services de recherche et d’instituts qui développent des techniques d’observation, en particulier dans le contexte actuel d’étude de l’évolution du climat liée aux forçages an- thropiques. La multiplication des observations ponctuelles (lors de campagnes de mesure) ou systématiques (avec l’installation d’appareils de mesure pérennes, le lancement de nouveaux satellites, ou la systématisation de radiosondages en un point géographique donné) permet d’améliorer la connaissance du climat et de sa variabilité. Ces observations sont également une source précieuse de données de comparaison afin d’évaluer les sorties des modèles.

2.2.1.2 Réanalyses

Il est intéressant de comparer les sorties d’un modèle de climat global à des champs pro- venant d’observations, mais à une échelle comparable. En effet, peut-on attendre d’un modèle qui a une échelle horizontale de 1◦ en latitude et longitude une reproduction fidèle de données de température relevées à un point précis du globe ? La réponse est bien évidemment non, et pas seulement pour des raisons de résolution. Le développement des modèles de circulation générale est né avant tout du désir de modéliser le climat à l’échelle du globe en intégrant l’ensemble de ces informations locales. Cette technique, appelée réanalyse, implique d’assi- miler l’ensemble des données provenant d’observations et d’en déduire via un modèle l’état des variables météorologiques à l’échelle globale sur une période historique donnée. L’avantage de cette méthode par rapport aux analyses opérationnelles faites par les centres de prévision du temps est l’homogénéité des champs sur l’ensemble de la période étudiée, du fait de l’utilisation d’une technique d’assimilation et d’un modèle de circulation générale figés et documentés.

Plusieurs centres de recherche produisent des réanalyses atmosphériques globales, comme le CEPMMT (réanalyses Era-40 (Uppala et al., 2005) et Era-Interim (Dee et al., 2011)), le Ncep (Saha et al., 2010), ou encore la Nasa (Rienecker et al., 2011). Dans cette thèse, nous avons utilisé la base de données de réanalyses Era-Interim du CEPMMT à la fois comme données de référence pour guider la composante Arpege-Climat du modèle CNRM-CM5.1

lorsque c’était nécessaire, mais aussi pour évaluer les prévisions du modèle (sauf pour les prévisions des précipitations, voir plus loin). Dans ce qui suit nous allons donc nous focaliser sur cette réanalyse en particulier.

La réanalyse est produite à partir d’une série de cycles d’assimilation de données, utilisant un modèle atmosphérique pour l’avance temporelle. Dans le cas d’Era-Interim, le schéma d’assimilation 4D-Var est utilisé avec un cycle de 12 heures pour les variables atmosphériques. Les champs de variables atmosphériques à un niveau donné sont enregistrés toutes les 3 heures, ainsi que les données de surface. Pour les surfaces continentales, une technique plus simple reposant sur une interpolation optimale des données de surface est utilisée. Le modèle utilisé est IFS (Integrated Forecast System), avec une résolution horizontale T255, 60 niveaux verticaux et un pas de temps de 30 minutes. Les conditions de surface imposées par l’océan proviennent des bases de données océaniques du Ncep.

Les données de la réanalyse forment un jeu de données globales tridimensionnelles cohé- rentes entre elles et contraintes par les données d’observation utilisées dans la phase d’as- similation. En moyenne, entre 106 (dans les années 1980) et 107 (pour la dernière décennie) données d’observation sont intégrées par jour dans le schéma d’analyse 4D-Var, dont la plupart proviennent de satellites. Plus de détails sur la provenance de ces données et leur validation peuvent être trouvés dans l’article de Dee et al. (2011).

La disponibilité de données à l’échelle globale représentant l’évolution de l’atmosphère sur une période de 30 ans pourrait nous faire oublier que ces données sont calculées par un modèle. Certes, l’évolution du modèle est fortement contrainte par des observations, mais le raccourci consistant à prendre les données des réanalyses pour la réalité est dangereux et peut mener à des erreurs d’interprétation. Toutefois, ces jeux de données sont très pratiques au sens où ils permettent d’évaluer les prévisions saisonnières à échelle globale. Le fait que les différentes réanalyses soient en général concordantes entre elles, du moins sur les paramètres évalués dans le cadre de cette thèse, rassure quant à la qualité des évaluations du modèle couplé de prévision saisonnière présentées par la suite.

2.2.1.3 Le cas des précipitations

Un cas particulier de données de réanalyses parfois problématiques est celui des données des précipitations. Dee et al. (2011) évoque ce problème en détail. Les modèles de circulation générale sont généralement peu propices à représenter de manière satisfaisante les précipita- tions, car cette sortie de modèle dépend de plusieurs paramétrisations physiques selon qu’on s’intéresse aux précipitations stratiformes ou convectives.

On a donc choisi dans le cadre de cette thèse d’utiliser les données issues de réanalyses spé- cifiquement dédiées aux précipitations comme les données GPCC du Deutscher Wetterdienst (Schneider et al., 2008) ou GPCP du WCRP (Huffman et al., 2009). La réanalyse GPCC utilise les données de près de 45000 pluviomètres pour estimer les précipitations mensuelles sur une période allant de 1901 à 2007 pour la version 4 utilisée dans le chapitre3. Ces données ne sont disponibles que sur les points de grille au-dessus des terres, à une résolution de 1◦. Les réanalyses GPCP intègrent à la fois les données pluviométriques utilisées dans la réanalyse GPCC et des jeux de données de satellites pour produire des données aux échelles mensuelles et pentadaires sur une période de 1979 à 2009, et à l’échelle quotidienne sur une période restreinte à 1997–2009. Les données mensuelles utilisées pour ce manuscrit proviennent de la

2.2 Evaluation des prévisions

version 2.2 des réanalyses, tandis que les données quotidiennes et pentadaires proviennent de la version 2.1 antérieure.

Plusieurs études comparant les différentes réanalyses des précipitations montrent que celles- ci sont fortement corrélées, avec une légère sous-estimation des précipitations dans GPCC par rapport à GPCP sur la plupart des régions.

Vu les années de disponibilité des données GPCP, les évaluations des précipitations des rétro-prévisions calculées dans le cadre de cette thèse portent le cas échéant sur des périodes se terminant en 2009, contrairement aux autres champs pour lesquels les données Era-Interim sont disponibles sur l’ensemble de la période de rétro-prévision.

2.2.1.4 Etalons d’évaluation

Les données d’observation peuvent servir d’étalons pour l’évaluation des prévisions sai- sonnières. En plus de comparer directement les sorties des modèles aux observations, on peut évaluer l’apport de l’utilisation d’un modèle par rapport à des techniques statistiques reposant uniquement sur les données d’observation d’une période passée.

Dans le cas particulier des rétro-prévisions, portant sur des saisons d’une période historique, ces étalons sont calculés en « validation croisée », c’est à dire en enlevant l’année courante de rétro-prévision des jeux de données.

Un premier étalon que nous utiliserons fréquemment est la climatologie, désignant ici la moyenne sur les N − 1 autres années de la période de rétro-prévision de la variable étudiée. Pour une saison s et une année yi de la période de rétro-prévision, la prévision saisonnière climatologique d’une variable X s’écrit :

Xclim(s, yi) = 1 N − 1 X y6=yi Xs,y

On peut également comparer les prévisions dynamiques à un étalon appelé persistance, qui consiste à prévoir le maintien des anomalies observées pour une variable X le mois précé- dent le début de la prévision (noté M − 1) sur l’ensemble de la saison à venir. Cette prévision s’écrit :

Xpers(s, yi) = Xclim(s, yi) + X(M − 1, yi) − Xclim(M − 1, yi)

A partir des données d’une période historique, des prévisions beaucoup plus sophistiquées, reposant sur des régressions de plusieurs paramètres comme par exemple les températures de surface de l’océan sur une zone précise, peuvent être calculées. Ces prévisions statistiques répondent généralement à une question précise (quelle sera l’anomalie de précipitations sur le Bénin ?) et un modèle statistique par paramètre et région est généralement nécessaire. Aussi avons-nous décidé de ne pas comparer ce type de prévisions à celles issues d’un modèle dynamique couplé, qui a pour but d’apporter une information globale sur le climat de la saison à venir.