• Aucun résultat trouvé

Diagnostics de valeurs extrêmes des précipitations et tests statistiques associés

Comme cela été mentionné en introduction, une des questions qui se posent dans ce travail porte sur la recherche de diagnostics adaptés à l’évaluation des performances d’ALADIN-Climat, en termes de représentation des événements de précipitations intenses dans le Sud-Est de la France (HPE).

Dans un premier temps, je ne vais toutefois m’intéresser qu’aux valeurs extrêmes de pluie simulées par ALADIN-Climat au travers de quantiles d’ordre élevé modélisés à l’échelle du point de grille. Et tant que les tests de sensibilité à la configuration du modèle ne conduiront pas à l’obtention de valeurs significativement différentes de ce diagnostic, il n’apparaîtra pas nécessaire d’envisager des diagnostics permettant de rendre plus précisément compte des HPE, si bien que cette question ne sera en fait traitée qu’à partir du chapitre 4, et les différentes méthodes d’analyses envisagées seront détaillées à ce moment là.

Par ailleurs, les domaines d’intégration des différentes simulations réalisées couvrent des zones plus étendues que le seul Sud-Est de la France, aussi l’analyse des résultats ne se limitera pas toujours à l’étude de cette seule région, et c’est aussi dans cette perspective plus générale que la représentation des pluies intenses sera abordée au travers des quantiles extrêmes de précipitation.

L’ordre des quantiles considérés correspondant à des durées de retour comprises entre environ 1 et 10 ans, on peut légitimement se poser la question de la justesse d’une estimation qui consiste à prendre directement les quantiles simulés par le modèle plutôt que de les déduire de l’ajustement d’une loi statistique d’extrême comme la GEV (voir chapitre 1, section 1.3.1). La raison première de ce choix est sa simplicité. Par ailleurs, dans l’interprétation qui sera faite des valeurs de quantiles simulées, on s’intéressera essentiellement à la comparaison de couples de simulations – que ce soit dans les études de sensibilité ou en scénarios – pour lesquelles on appliquera un test de significativité des différences constatées, et ce test implique en fait une estimation des valeurs de quantiles par ajustement de la série des précipitations simulées à une loi de Pareto Généralisée (GPD).

Dans la littérature, la plupart des études qui s’attachent à tester la significativité de différences de quantiles extrêmes de précipitations emploient des méthodes dite de « bootstrap ». Leur principe consiste à ré-échantillonner la série de données en effectuant

N tirages avec remise dans les éléments de la série. En résultent N échantillons de même

taille que la série d’origine dont on peut calculer les quantiles « bootstrapés ». A partir de la série des N quantiles « bootsrapés », il est possible de réaliser des tests classiques d’égalité et calculer des intervalles de confiance.

Si cette technique est pertinente sur une bonne partie des distributions classiquement étudiées, elle présente des limites assez importantes sur la toute fin du spectre, et donc sur les quantiles extrêmes de précipitations considérés dans cette étude. Premièrement, le ré-échantillonnage ne permet pas d’obtenir une bonne estimation des valeurs extrêmes (pensons par exemple à la valeur maximale qui dans les N échantillons ne pourra jamais excéder le maximum de la série d’origine). D’autre part, le calcul du niveau de confiance du test appliqué aux séries de quantiles « bootstrapés » obtenus après ré-échantillonnage nécessite d’estimer des quantiles d’ordre assez extrême (pour un niveau de confiance de 5%,

Section 2.3 : Diagnostics de valeurs extrêmes des précipitations et tests

statistiques associés 41

il faut estimer les quantiles d’ordre 2.5% et 97.5% de la série de quantiles « bootstrapés »), ce qui requiert soit d’effectuer beaucoup de tirages dans le ré-échantillonnage afin d’obtenir un N élevé, soit de supposer que les quantiles bootsrapés suivent une loi gaussienne, ce qui sera d’autant plus faux que l’ordre du quantile étudié sera élevé et que la taille de l’échantillon sera petite.

Pour toutes ces raisons, la comparaison des quantiles extrêmes de précipitations sera plutôt testée grâce à une autre méthode, mise en place par De Lozzo (2009).

L’idée consiste à modéliser la queue de distribution par une fonction POT (Peak Over

Threshold) Fu représentant les valeurs dépassant le seuil u. Lorsque u tend vers l’infini Fu

tend vers la loi de Pareto Généralisée (GPD, Generalized Pareto Distribution) H(y, ψ, ξ) donnée par : H(y, ψ, ξ) = ( 1− (1 + ξy ψ) −1 ξ si ξ 6= 0 1− e−y ψ si ξ = 0 (2.17) où ψ est le paramètre d’échelle et ξ le paramètre de forme.

Le quantile extrême d’ordre α, qα, peut alors s’écrire :

qα = u +

ψ

ξ[(mζu)

ξ

− 1] (2.18)

où ζu est la probabilité qu’une valeur de l’échantillon dépasse le seuil u (ζu = P (X > u)).

ψ et ξ sont alors estimés par maximum de vraisemblance, et ζu est estimé par Nu/N

où N est la taille de l’échantillon considéré et Nu le nombre de données de l’échantillon

dépassant le seuil u. On obtient ainsi un estimateur de qα, noté ˆqα.

Par suite des propriétés de l’estimateur du maximum de vraisemblance appliquées à ˆψ et

ˆ

ξ, on aboutit à :

ˆ

qα → N (qα, σq2α) (2.19)

où (qα, σ2qα) est la loi normale d’espérance qα et d’écart type σqα, σqα étant une notation

faisant intervenir l’ensemble des données de l’échantillon, les paramètres ψ, ξ et ζu, ainsi

que les tailles N et Nu et l’ordre α du quantile qα (voir De Lozzo (2009) pour l’expression

de σqα).

L’égalité de deux quantiles d’ordre α, qα,1 et qα,2 peut alors être évaluée par un test de

Student appliqué aux deux lois normales correspondantes ((qα,1, σq2α,1) et (qα,2, σ

2 qα,2). Pour le choix du seuil u on prendra la valeur correspondant au quantile d’ordre 98% des échantillons testés.

2.4 Climatologies de référence

Pusieurs jeux de données sont utilisés pour la validation des expériences réalisées (simu- lations « hindcast », « Big-Brother » ou période de contrôle des scénarios de changement climatique). L’essentiel de l’analyse des résultats prendra pour référence les climatologies CRU TS 2.1 et SAFRAN. Elles présentent toutes deux l’avantage d’être des climatologies en points de grille, et comme nous l’avons mentionné au chapitre 1, ce format facilite l’ana- lyse des sorties de modèle dans la mesure où il fournit une couverture spatiale homogène, plus aisément comparable aux champs simulés. Ce faisant, il implique un traitement des données – interpolation ou assimilation – qui interdit de pouvoir parler stricto sensus d’ob- servations pour qualifier ces données qui représentent davantage une valeur moyenne sur les mailles de leur grille qu’une observation ponctuelle.

2.4.1 La climatologie CRU TS 2.1

Pour la validation des champs moyen, on se basera sur la climatologie CRU TS 2.1 (Mitchell and Jones, 2005). Tous les détails concernant la méthode de construction de cette climatologie figurent dans Mitchell and Jones (2005), seules les caractéristiques du produit final sont rappelées ici.

CRU TS 2.1 fournit des séries mensuelles sur la période 1901-2002 à une résolution de 0.5˚ sur tout le globe (soit environ 50 km sur l’Europe) pour les variables suivantes : température à 2 mètres, précipitation, variation diurne de température à 2 mètres, température à 2 mètres minimale et maximale quotidienne, fréquence de jours de pluie, fréquence de jours de gel, humidité, pression de vapeur saturante, et nébulosité.

Les données de CRU TS 2.1 sont utilisées ici pour la validation des moyennes mensuelles de précipitations et de températures à 2 mètres. Seules ces deux variables ont donc été extraites de la climatologie, et les moyennes mensuelles sont toutes calculées sur la période 1979-2000.

Si la couverture spatiale offerte par CRU TS 2.1 en fait une référence adéquate pour une validation basique des expériences réalisées, sa résolution spatio-temporelle ne permet pas de s’intéresser aux extrêmes de précipitations quotidiennes, pour lesquelles ce sont les données de l’analyse de SAFRAN qui seront exploitées.

2.4.2 L’analyse SAFRAN

SAFRAN (Système d’Analyse Fournissant des Renseignements Atmosphériques à la Neige) fournit des données au pas de temps horaire à 8 km de résolution sur la France, pour la période 1958-présent. Seules les précipitations, ramenées à la fréquence quotidienne, sont utilisées ici.

Dans ses premières versions (Durand et al., 1993, 1999), ce produit était destiné à fournir des paramètres utiles à la prévision du risque d’avalanche par un modèle de neige, il ne couvrait de ce fait que les zones de montagne. Ses spécifications se sont ensuite élargies afin de pouvoir être utilisé comme composante atmosphérique dans l’outil de suivi de la ressource en eau et de prévision des crues et des sécheresses SAFRAN-ISBA-MODCOU (SIM) (Habets et al., 2008). L’analyse SAFRAN s’est alors étendue à l’ensemble du terri- toire de France métropolitaine. La version utilisée ici est celle décrite dans Quintana-Seguí et al. (2008) et Vidal et al. (2009).

Section 2.4 : Climatologies de référence 43

Le principe de construction de l’analyse SAFRAN est assez similaire au processus d’as- similation de données dans un modèle de prévision numérique opérationnel : elle résulte de l’intégration d’observations de stations à des ébauches issues de ré-analyses produites par le centre européen (ECMWF). Le domaine couvert est divisé en 612 zones d’environ

1000 km2 où le climat est homogène (voir figure 2.6), chacune de ses zones contenant en

moyenne 5 à 6 points d’observation de précipitation (Vidal et al., 2009). L’analyse en tant que telle conduit à l’estimation d’une valeur par zone et par variable, et ce pour différents niveaux d’altitude. Cette opération est effectuée à une fréquence quotidienne pour les pré- cipitations, ces dernières sont ensuite interpolées au pas de temps horaire. Pour terminer, les données sont interpolées spatialement sur une grille de 8 km x 8 km en tenant compte de l’orographie (dérivée de GTOPO30) via un profil vertical linéaire.

Dans le premier chapitre, il est fait référence à la climatologie en points de grille E-OBS

Fig.2.6 – Zonage et orographie utilisés pour l’analyse SAFRAN (figure extraite de Quintana-Seguí et al.

(2008)

.

(Haylock et al., 2008) disponible à 25 km de résolution sur l’Europe, et nous avons men- tionné que celle-ci n’était pas des plus appropriées pour ce qui est de la validation des extrêmes de pluie. Hofstra et al. (2009) et Hofstra et al. (2010) ont en effet montré que E-OBS présentait des limites assez importantes à cet égard, en raison du fait qu’un certain nombre de maille contiennent trop peu de données de stations – et même aucune dans certains cas – et que les opérations d’interpolation réalisées pour la construction de la cli- matologie en points de grille conduisent à une sous-estimation des extrêmes de pluie ; les deux effets conjugués générant des biais atteignant -19% à -50%.

La densité des observations incluses dans SAFRAN et la résolution finale du produit en font donc un outil précieux de validation des extrêmes de précipitation simulés, en parti- culier dans l’étude de la valeur ajoutée de l’emploi d’une très haute résolution (12.5 km) (voir chapitre 4).

Signalons cependant que par comparaison aux données de stations d’observation, SAFRAN sous-estime parfois les cumuls de pluies les plus importants dans le Sud-Est de la France. Mais pour l’utilisation qui est en faite dans ce travail, cet inconvénient est moindre par rapport à ceux qui découleraient du fait d’utiliser des valeurs ponctuelles et disparates dans l’espace.

2.4.3 Dates des événements précipitants intenses dans le Sud-Est

de la France (HPE)

Pour l’étude détaillée de la représentation des épisodes de pluies intenses dans le Sud- Est de la France (HPE), je me référerai également à une liste de dates d’occurrence de ces événements sur la période 1960-2000 (voir annexe D). Cette dernière résulte de l’ana- lyse d’observations de stations réalisée par Nuissier et al. (2011) dans le cadre du projet CYPRIM. Les critères objectifs permettant de définir précisément ces événements seront détaillés au chapitre 4.