CARACTÉRISATION DE L'INCOHÉRENCE PHYSIQUE ENTRE LES TEMPÉRATURES JOURNALIÈRES EXTRÊMES CAUSÉE PAR LA TECHNIQUE D'AJUSTEMENT QUANTILE-QUANTILE UNIVARIÉE: CAS
D'ÉTUDE DE LA BAIE D'HUDSON
MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE
DE LA MAÎTRISE EN SCIENCES DE L'ATMOSPHÈRE
PAR
MÉDARD NOUKPO AGBAZO
UNIVERSITÉ DU QUÉBEC À MONTRÉAL Service des bibliothèques
Avertissement
La diffusion de ce mémoire se fait dans le respect des droits de son auteur, qui a signé le formulaire Autorisation de reproduire et de diffuser un travail de recherche de cycles supérieurs (SDU-522 - Rév.0?-2011 ). Cette autorisation stipule que «conformément à l'article 11 du Règlement no 8 des études de cycles supérieurs, [l'auteur] concède à l'Université du Québec à Montréal une licence non exclusive d'utilisation et de publication de la totalité ou d'une partie importante de [son] travail de recherche pour des fins pédagogiques et non commerciales. Plus précisément, [l'auteur] autorise l'Université du Québec à Montréal à reproduire, diffuser, prêter, distribuer ou vendre des copies de [son] travail de recherche à des fins non commerciales sur quelque support que ce soit, y compris l'Internet. Cette licence et cette autorisation n'entraînent pas une renonciation de [la] part [de l'auteur] à [ses] droits moraux ni à [ses] droits de propriété intellectuelle. Sauf entente contraire, [l'auteur] conserve la liberté de diffuser et de commercialiser ou non ce travail dont [il] possède un exemplaire.»
La rédaction de ce mémoire a été rendue possible grâce au soutien continuel de mon directeur de recherche, monsieur Patrick GRENIER, membre du groupe Scénarios et services climatiques d'Ouranos et professeur associé au Centre pour l'Étude et la Simulation du Climat à l'Échelle Régionale (ESCER) de l'Université du Québec à Montréal (UQAM). Je vous remercie monsieur le professeur pour m'avoir appuyé et donné l'opportunité de réaliser ce projet. Un vif remerciement à vous pour m'avoir inculqué la rigueur scientifique et surtout pour avoir rehaussé mon niveau en programmation informatique. Un remerciement spécial est dédié au professeur René LAPRISE pour son soutien incommensurable du début à la fin de cette maîtrise.
Je remercie· les deux autres membres de jury, les professeurs François ANCTIL et Jean-Pierre BLANCHET qui ont accepté de juger la qualité de ce travail.
Je tiens à remercier très chaleureusement Adelina ALEXANDRU, qui est une madame avec un énorme cœur.
Je remercie l'UQAM de m'avoir accordé une bourse d'excellence (FARE) et une bourse d'exemption des frais de scolarité majorés pour étudiants étrangers. Mes sincères remerciements au programme de recherche ArcticNet pour avoir fortement financé mes travaux de recherche.
LISTE DES FIGURES ... , ... v
LISTE DES TABLEAUX ... ix
LISTE DES ABRÉVIATIONS, DES SIGLES ET DES ACRONYMES ... x
Liste des symboles et des unités ... xii
RÉSUMÉ ... xiv
CHAPITRE I INTRODUCTION ... 15
1.1 Problématique ... 15
1.1.1 Modèle climatique ... 15
1.1.2 Les limites des simulations climatiques ... 16
1.1.3 Les raisons du post-traitement des simulations climatiques ... 17
1.1.4 L'idée générale du post-traitement ... 17
1.1.5 Les techniques de post-traitement statistique couramment utilisées ... 18
1.1.6 Technique d'ajustement quantile-quantile ... 19
1.2 Les objectifs de 1' étude ... 21
1.2.1 Questions de recherche ... 22
1.2.2 Objectifs spécifiques ... 22
1.3 Région d'étude ... 23
1.3.1 Climat général de la Baie d'Hudson ... 23
1.3.2 Importance de l'information climatique pour la Baie d'Hudson ... 24
1.4 Structure du mémoire ... 25
CHAPITRE II CHARACTERIZA TION OF PHYSICAL INCONSISTENCY GENERA TED BY UNIV ARIA TE QUANTILE MAPPING OF DAIL Y TEMPERA TURE EXTREMA : A CASE STUDY OVER HUDSON BA Y ... 31
2.1 Introduction ... 32
- - -
-- - - - -
--2.2 Data sets and methods ... 34 2.2.1 Data sets ... : ... 34 2.2.2 Methods ... 35 2.3 Results ... 42 2.3.1 Factors ofrisk ... 42 2.3.2 Sensitivity to QM variants ... 42
2.3.3 Loss ofstatistica1 equivalence ... 44
2.4 Summary with concluding remarks ... 45
CHAPITRE III IMPACT OF TREND PERTUBATION, SEA ICE COYER BlASES AND DIURNAL TEMPERATURE RANGE BlASES ON THE FREQUENCY OF OCCURRENCE OF PHYSICAL INCONSISTENCY ... 60
3.1 Investigation methods ... 60
3.1.1 Trend perturbation and FoO of negative DTR. ... 60
3 .1.2 Impact of SIC and DTR biases ... 61
3.2 Results ... 62
3.2.1 Trend perturbation and FoO of negative DTR. ... 62
3.2.2 Impact ofbias in SIC and DTR on negative DTR ... 63
3.3 Conclusion ... 64
CHAPITRE IV CONCLUSION ... 72
4.1 Lien entre la perturbation de la tendance simulée et la FoO des ETJ négatifs ... 74
4.2 Impact des options et du paramètre de la technique Q-Q sur la FoO des ETJ négatifs ... 7 5 4.3 Impact du biais dans la concentration de glace de mer et des ETJ simulés ... 76
4.4 Évaluation de l'efficacité des alternatives pour éviter le problème des ETJ négatifs ... 76
ANNEXE A MATHEMATICAL DEVELOPMENT OF QUANTILE MAPPING TECHNIQUE ... 79
Figure
1.1 Fonction de distribution cumulative des températures journalières maximales (Tmax) pour 1979-2010 et le point de grille (60.41 o N, -78.75 °E), correspondante à la simulation SIM-14 (rouge) et au produit de référence CFSR (noir). Les points montrent, pour chaque distribution,
Page
les centiles 0, 1, 3, 5, ... 97, 99, 100 ... 26
1.2 Cycle annuel des températures minimales et maximales journalières (T min et Tmax) pour 1979-2010 et le point de grille (59.16° N, -94.06° E), correspondant respectivement à la simulation SIM-09 (rouge), aux scénarios (vert), et au produit de référence CFSR (noir); (panel, a) cas des températures minimales journalières (Tmin); et (panel, b) cas des températures maximales journalières (T max) ... 27 1.3 Schématisation de la technique de sélection de la largeur de la fenêtre
mobile (LFM = 2D+ 1), avec D correspondant au nombre de jour avant et après le jour de l'année à post-traiter. Il est nécessaire que : 1 ;;:::k et rn ~; c'est-à-dire que l'étendue temporelle de la série observée utilisée pour calibrer la simulation soit couverte par 1 'étendue temporelle de cette simulation... 28
1.4 Écart thermique journalier (ET]Th12) déduit des températures minimales et maximales journalières post-traitées pour la période 1979-2010, la simulation SIM-14 et le point de grille (60.41° N, -78.75° E)... 29
1.5 Spatialisation du nombre d'occurrence d'ETJ négatif pour la période 1981-1999, avec un maximum à 520 cas. Reproduction de la Figure 1 de Thrasher et al. (2012) ... 30
2.1 CFSR ocean grid tiles of the Hudson Bay area; calculations are performed only for the 1036 grid til es appearing in red; grid tiles
appearing in blue have been discarded because at least one of the simulations used (see Section 2.1.2) has a corresponding grid tile ofland type (severa} grid tiles on the Atlantic side were of maritime nature in ali simulations but were discarded because they ended up disconnected from the grid til es appearing here in red)... 50
2.2 The illustration of condition ( eq. Il) for the generation of negative
DTRbasic values, with oQM and DTRsim values for two Do Y (January 2nd
and July 2nd) (each circle represents one of the 122 years of the application period 1979-21 00). Black, cyan and red circles represent respective! y cases of negative oQM, positive oQM and oQM greater than DTRsim. Red line is the 1:1 line. These values correspond with SIM-56, the grid tile centred at 59.16°N, -88.56 °E, and the QM(free, 31) variant.. 51 2.3 The number of negative DT Rbasic values per 2-dimensional bins for
DTRsim and oQM• per season, for the QM(free, 31) variant. Ali grid tiles and ali post-processed simulations are considered, for a total number of - 1x109 tested cases for each season ........ 52
2.4 The FoO of negative DTRbasic for each of the 83 simulations used, considering ali 1036 grid til es during the period 1979 to 2100, as obtained with QM(free, 31) (filled circles) and QM(forced, 31) (empty circles). Each panel corresponds with one model (see Table 2.1), the circles color indicates the RCP (magenta for RCP2.6, green for RCP4.5, blue for RCP6.0, and red for RCP8.5), and the number written on each dot indicates the member (e.g.: "6" stands for CMIP5 code r6i1p1) ... 53 2.5 The absolute value of the maximum (panels a to t), and also the median
(panels g to 1) of the 83 maximal amplitudes of negative DTRbasic, for each grid tile and six QM variants (crossing both detrending options with
Wvalues 31,41 and 91 days)... 54
2.6 The FoO of negative DTRbasic for ali investigated QM variants and for three selected simulations, considering ali 1036 grid til es during the period 1979 to 2100. Lower panels represent, for the same simulations as above, the FoO obtained per month and per W value with QM(forced, W)
2.7 The DKs statistics averaged over the 83 simulations, for the months of January (panels a, b, e, f, i, j, rn and n) and July (panels c, d, g, h, k, 1, o and p ), for all approaches and the direct outputs... 56 2.8 The average between the spatially-averaged DKs values, per month, per
approach and per simulation for Tmin and Tmax· Black, green, cyan, magenta and red lines represent respectively basic approach, alt. 1, alt. 2, alt. 3 and raw simulations. Only the average DKs values less than or equal to 0.2 are represented... 57 2.9 Monthly-averaged spatially-averaged DKs values grid cells, per approach
and per simulation, averaged between Tmin and Tmax. Black, green, cyan, magenta and red lines represent respectively the basic approach, alt. 1, alt. 2, alt. 3 and raw simulations... 58 2.10 Monthly percentage of cases for which an approach leads to better
statistical equivalence than another (1 036 x 83
=
85 988 cases per month). Black, green and blue !ines represent respective! y the cases of (ait. 1 and ait. 3), (alt. 2 and alt.3) and (alt.1 and ait. 2). Here (X and Y) means that approach X is efficient than Y... 59 3.1 ~a-avg values obtained with QM(free, 31) for each simulation, in°C/century. Following Table 2.1, each panel represents one GCM and the color of each dot refers to the RCP. The color of each symbol indicates the RCP (magenta for RCP2.6, green for RCP4.5, blue for RCP6.0 and red for RCP8.5). The number written on each dot indicates the simulation member (the x in standard code rxi1p1)... 66 3.2 The scenario-averaged Oa per grid tile, in °C/century/ scenario... 67
3.3 The ~a-avg values for each simulation and their FoO of negative DTRbasic
generated by QM(free, 31). On the y axis, a value of 1 would correspond with 100%. Following Table 2.1, each dot represents one GCM and its color refers to the RCP (magenta for RCP2.6, green for RCP4.5, blue for RCP6.0 and red for RCP8.5) ... 68 3.4 Monthly Pearson and Spearman correlation coefficients (rPea and rspe)
between on the one hand ~a-avg values and on the other hand Foü of negative DTRbasic generated by QM(free, 31) ( each scenario contributes one value) . . . ... . ... . ... . . ... . . ... . . .. . . .. .. . ... .. . .. . . . .. . . .. .. . . ... . . ... . . ... ... .. . . .. . . 69
3.5 The scenario-averaged FoO of negative DTR generated by the QM(free,
31) (panel, a) and by QM(forced, 31) (panel, b) at each grid tile ... 70
3.6 Spearman correlation coefficient between on the one hand monthly
(FoO) of negative DTRbasic and on the ether hand either monthly S/Csim
.(black dots) or DTRsim (red dots) biases, per simulation. Empty circles
mean the result is not statistically significant while solid circles mean
Tableau Page
2.1 Information for identifying CMIP5 simulations used in this study. The first column refers to the label used in this paper. Each row corresponds with one mode!. Numbers in the four columns on the right refer to the number of mode! members for the corresponding Representative Concentration Pathway (RCP). For each mode!, the labeling order is first by member number, and next by RCP intensity (e.g. : SIM-60, SIM-61, SIM-62, SIM-63 and SIM-64 correspond with RCP2.6- rli1p1, RCP4.5 - r1ilp1, RCP8.5 - rli1pl, RCP4.5 - r2i1p1, and RCP4.5 - r3i1p1, respective! y), as can be seen in Figure 2.4 ... 48
2.2 Variables involved in the different approaches for statistically post-processing Tmin and Tmax· Sqperscript "qm" indicates that the variable is directly (and independently) post-processed, whereas ali other superscripts refer to a deduced variable from the two directly post-processed variables of the approach ... 49
3.1 The monthly 95% confidence intervals indicated by Fisher's z transformation test for correlation coefficient presented on Figure 3.4. The interval in bold indicates a lack of statistical significance.. ... ... ... .. . .. . 65
CFL . CFSR CGM CI CMIP5 Do
Y
DTR ECDF ENSO ESC ER ETJ FoO FQM GCM IP KS LFM MGC MRC MoY PTS QM RCMcondition frontière latérale
Climate Forecast System Reanalysis concentration de glace de mer condition initiale
Coupled Model Inter-comparison Project phase 5 day of the year
diurnal temperature range
empirical cumulative distribution function El Nifio-Southem Oscillation
Centre pour l'Étude et la Simulation du Climat à l'Échelle Régionale écart thermique journalier
frequency of occurrence
transfer function in the quantile mapping technique general circulation model
incohérence physique Kolmogorov-Smimov largeur de la fenêtre mobile modèle global du climat modèle régional du climat mon th of the year
post-traitement statistique quantile mapping
RCP representative concentration pathway SIC sea ice concentration
SPP statistical post-processing SoY season of the year
SIM-x simulation number x
Th2012 Thrasher et al. (20 12) recommendation UQAM Université du Québec à Montréal
DT RCFSR CFSR diurnal temperature range
DT Rsim initial simulated diurnal temperature range
DTRqm diurnal temperature range obtained by directly post-processed
DKs Kolmogorov-Smirnov statistic
F
Q M (T%-/'::J:)
trans fer function of simulated dail y maximal temperature F Q M ( T ;.:;;: ) trans fer function of simulated dail y minimal temperatureFQM quantile mapping transfer function
T min daily minimal temperature
Tmax daily maximal temperature
Ti.,.i':;J:
.
simulated daily maximal temperatureT;,:g:_
simulated daily minimal temperatureT!":x daily maximal temperature obtained with direct post-processing
T!7:t
daily minimal temperature obtained with direct post-processingDTRbasic diurnal temperatUre range deduced from T!":x and
T-!7:t
T::,.~~1 daily minimal temperature deduced by alternative 1
T~~; daily maximal temperature deduced by alternative 2
Tiitf.fxR
CFSR daily maximal temperatureT~f~R CFSR daily minimal temperature
T::,.~t_; daily minimal temperature deduced by alternative 3
T~~ daily maximal temperature deduced by alternative 3
T~~~y the temperature halfway between T.;:[;:_ and Titi:Ji rspe Spearman linear correlation coefficient
OQM
Th2012 PIdifference between
FQM(T;;[;:)
and FQM(T~iJ;;;) Thrasher et al. (2012) recommendationphysical inconsistency degré Celsius
FQQ fonction de transfert dans la technique d'ajustement quantile-quantile Bm,j(DTR) biais dans les écarts thermiquesjoumaliers·du mois met au point de grillej Bm,j(SIC) biais dans les concentrations journalières de glace de mer du mois met au
point de grille j
DT RTh2012 écart thermique journalier obtenu indirectement suivant la recommandation de Thrasher et al. (2012)
S/Csim concentration journalière de la glace de mer simulée SJCCFSR concentration journalière de la glace de mer de CFSR
m(T!7:J
tendance linéaire de la moyenne annuelle de T:::'::tm(T!:X)
tendance linéaire de la moyenne annuelle deT!:X
m(T;;t;:)
tendance linéaire de la moyenne annuelle des T;;[;: m(T~iJ;;;) tendance linéaire de la moyenne annuelle des T~iJ;;;a!%
perturbation de tendance des températures minimales journalières a!::x perturbation de tendance des températures maximales journalièress: d"f~' qm qm
ua 1 1erence entre amin et amax
Ôamoyen Oa moyen pour l'ensemble des 1036 points de grilles Q-Q ajustement quantile-quantile
L'ajustement quantile-quantile (Q-Q) est une technique de post-traitement qui vise à corriger les biais des simulations générées par des modèles numériques du climat. Une de ses limitations est quelle a le potentiel de générer deux types d'incohérence physique (IP). Le type 1 réfère à l'attribution d'une valeur impossible à une variable et le type 2 réfère à la brisure d'une relation inter-variable fixe. Par exemple, l'IP de type 2 peut se manifester par de situations où le post-traitement univarié des températures minimales (Tm;n) et maximales (Tmax) diurnes génère des jours pour lesquels Tm;n > T max· En se basant sur une analyse pour un domaine continental, certains auteurs ont recommandé, afm d'empêcher la génération de tels cas, de post-traiter l'écart thermique journalier (ETJ= Tmax- Tm;n) et Tmax, puis de déduire ensuite Tm;n (alternative 1), ou vice versa (alternative 2). Le présent mémoire a pour objectif principal d'étudier cette recommandation pour un domaine maritime (la Baie d'Hudson), et plus spécifiquement : 1) d'étudier les conditions dans lesquelles les valeurs de ETJ négatif sont générées, 2) d'analyser l'impact des paramètres et options de la technique Q-Q sur la fréquence d'occurrence (Foü) des ETJ négatifs générés, 3) d'inter-comparer trois alternatives permettant d'éviter le problème en termes de perte d'équivalence statistique avec le produit de référence, 4) d'étudier le lien potentiel entre la perturbation de la tendance simulée (par Q-Q) et la FoO des ETJ négatifs, et 5) d'étudier la relation potentielle entre d'une part la Foü des ETJ négatifs et d'autre part les biais dans les con~entrations de glace de mer (CGM) et dans les ETJ simulés.
Les résultats révèlent entre autres que : 1) les situations de ETJ négatifs apparaissent préférentiellement pour les petites valeurs de ET J simulés, mais le différentiel entre les biais respectifs de Tmax et Tm;n joue aussi un rôle important; 2) on ne peut pas remédier complétement à la génération des situations des ETJ négatifs en ajustant simplement les paramètres et options de la technique Q-Q étudiés ici, mais forcer la préservation de la tendance génère moins de cas de ETJ négatif; 3) l'alternative 1 est généralement la meilleure, en termes de perte en équivalence statistique avec le produit de référence, mais ce résultat n'est pas systématique; 4) la Foü des ETJ négatifs est liée à l'intensité du scénario d'émissions utilisé pour forcer les modèles; et 5) il existe pour les mois d'été une forte relation entre les Foü des ETJ négatifs et les biais initiaux des ETJ simulés, ce qui n'est pas le cas avec les biais dans le couvert de glace.
Mots clés : Technique d'ajustement quantile-quantile, incohérence physique inter-variable, Baie d'Hudson, correction de biais, scénario et simulation climatiques.
-INTRODUCTION
1.1 Problématique
1.1.1 Modèle climatique
Les modèles globaux et régionaux du climat (MGC et MRC) sont des représentations
numériques du système climatique, exprimées sous forme de codes informatiques et
exécutées sur des ordinateurs puissants. Ils sont dérivés de lois physiques
fondamentales telles que les lois de la conservation de la masse, de l'énergie et de la
quantité de mouvement (Solomon et al., 2007). Ils permettent de simuler le climat de
la Terre à l'échelle globale et régionale (Randall et al., 2007). Les MGC ont une grille
couvrant le globe au complet. De nos jours, les MRC sont largement utilisés, afin de
régionaliser les résultats des MGC, c'est-à-dire de produire de l'information
climatique sur des zones limitées (Giorgi et Meams, 1999 et Wang et al., 2004).
Cependant pour pouvoir réaliser cette régionalisation, les MRC ne couvrent qu'un
domaine à aire limitée, ce qui nécessite, en plus des conditions initiales (CI), des conditions aux frontières latérales (CFL) fournies par un MGC ou encore par des
ré-analyses (Nikiéma et Laprise, 2011). Les projections de conditions climatiques
futures utilisées dans les services climatiques s'appuient principalement sur les
résultats des ensembles de MGC et MRC, par exemple PRUDENCE (Christensen et
Christensen, 2007), CMIP3 (Meehl et al., 2007), ENSEMBLES (van der Linden et
EURO-CORDEX (Kotlarski et al., 2014). Des scénarios plausibles d'émissions de gaz à effet de serre sont utilisés pour forcer les simulations. Les modèles numériques représentent les meilleurs outils disponibles pour les études portant sur les climats futurs plausibles puisque la sensibilité des différentes variables climatiques aux
forçages externes y est basée sur le fonctionnement physique du système climatique.
La. physique telle que représentée dans les modèles ne doit par contre pas être interprétée comme un équivalent exact de la physique sous-jacente au système réel.
1.1.2 Les limites des simulations climatiques
Pour les applications climatologiques, souvent de nature locale, les simulations
climatiques ne peuvent pas toujours être utilisées directement. La raison principale en est qu'il existe sur de longues périodes (généralement 30 ans) des biais entre certaines de leurs propriétés statistiques et celles des produits de référence (généralement des observations in situ, une ré-analyse ou un produit interpolé sur grille). Ces biais émanent a priori : 1) des imperfections liées à la discrétisation, au paramétrage et à l'incomplétude (Oreskes et al., 1994; Sellers et al., 1996; Suklitsch et al., 2008;
Müller et al., 2010); 2) de la disparité d'échelle et surtout de la résolution trop
grossière des simulations climatiques (~100-300 km pour GCM, ~ 10-50 km pour
RCM) (Wood et al., 2004); 3) de la forte sensibilité des simulations climatiques aux conditions initiales (CI) en raison de la nature chaotique du système atmosphérique (Lorenz, 1967); 4) de la non-synchronicité entre les variabilités naturelles réelles et simulées à basse fréquence (Eden et al., 2012); 5) et des imperfections dans les produits de référence eux-mêmes (Way et al., 2016; Diaconescu et al., 2017). Elles sont a posteriori constatés en considérant les défauts dans la représentation des phénomènes émergents comme ENSO (El Nifio Southem Oscillation), et les moussons ainsi que les biais dans les climats locaux (Hawkins and Sutton, 2009;
Rauscher et al., 2010; Meams et al., 2012; Bellenger et al., 2013; Flato et al., 2013; Cannon, 2016; Zhao et al., 2017).
1.1.3 Les raisons du post-traitement des simulations climatiques
Les changements climatiques et la variabilité climatique favorisent une demande croissante d'évaluations d'impact climatiques sophistiquées et robustes qui servent divers domaines de recherche et divers décideurs (GIEC: Hartmann et al., 2013; Kirtrnan et al., 2013). Ces évaluations sont généralement effectuées en utilisant des modèles d'impact qui ont besoin d'intrants non-biaisés et à l'échelle locale (Berg et al., 2003; Ines and Hansen, 2006; Salzmann et al., 2007; Muerth et al., 2013; Teng et al., 2015). Ces exigences incontournables des modèles d'impact du changement climatique correspondent aux limites des simulations climatiques mentionnées dans la sous-section 1.1.2. Ces limites des simulations climatiques constituent donc les raisons pour lesquelles elles doivent être post-traitées avant qu'elles ne puissent être utilisées efficacement dans les études d'impact des changements climatiques (Wood et al., 2004; Christensen et al., 2008; Maraun et al., 2010; Bosshard et al., 2011, 2013; Fang et al., 2015). D'où la pertinence du post-traitement des simulations climatiques afin de corriger les biais et/ou de mettre à l'échelle.
1.1.4 L'idée générale du post-traitement
Le PTS consiste à inclure les simulations climatiques dans un raisonnement plus large qui tient compte d'autres informations comme des observations in situ ou des produits basés sur les observations (ThemeBl et al., 2011; Maurer et al., 2012; Cannon, 2016). Un scénario climatique correspond donc à une trajectoire climatique amalgamant les propriétés statistiques d'une simulation avec celles d'un produit d'observation choisi (Meams et al., 2001; Gennaretti et al., 2015).
L'idée centrale des techniques de PTS est d'établir une relation statistique entre une simulation climatique et des observations pour une période historique (dite de calibration). Ces relations se retrouvent sous forme de fonctions de transfert qui sont ensuite utilisées pour transformer les simulations climatiques à l'échelle locale et pour
corriger certains aspects des biais de la simulation. De nombreuses techniques de PTS ont été développées dans la littérature (Schmidli et al., 2006; Boé et al., 2007;
Lenderink et al., 2007; Leander et al., 2008; Chen et al., 2013). Ces techniques permettent d'ajuster des propriétés statistiques choisies de manière subjective (chaque technique correspond à un certain ensemble de choix). Ces propriétés peuvent être par exemple la moyenne, la variance, des moments d'ordres supérieurs de la distribution ou encore les corrélations inter-variables. Une technique de PTS peut aussi impliquer qu'un scénario emprunte une certaine propriété statistique à la simulation, comme c'est parfois le cas avec la tendance climatique à long-terme, alors que d'autres propriétés statistiques sont incontrôlées, dans le sens où la technique de PTS a sur elles des impacts à la fois non souhaités et difficiles à prévoir. L'utilisation directe d'une simulation comme scénario peut être vue comme un cas limite de PTS, dans lequel il est décidé d'emprunter l'entièreté des propriétés statistiques du scénario à la simulation.
1.1.5 Les techniques de post-traitement statistique couramment utilisées
Les techniques de post-traitement statistique ayant été développées à travers le temps sont nombreuses et chacune. se présente généralement sous de nombreuses variantes. De plus, la terminologie utilisée pour décrire une même technique peut varier (Gudmundsson et al., 2012). Parmi les techniques de PTS les plus couramment utilisées se trouvent : (1) l'approche du changement delta (Hay et al., 2000); (2) la régression linéaire multiple (Hay et al., 2003; Von Storch, 1999); (3) la méthode des analogues (Von Storch,1999; Moron et al., 2008); (4) la mise à échelle d'intensité locale (Widmann et al., 2003; Schmidli et al., 2008); et (5) la technique d'ajustement quantile-quantile (Q-Q) (Wood et al., 2002). Différentes techniques de PTS ont été comparées dans des études récentes (ThemeBl et al., 2011; Teutschbein et Sei bert,
2012; Raisanen et Raty, 2013; Raty et al., 2014). Beaucoup de ces études identifient
-la technique Q-Q comme la technique la plus appropriée (Teutschbein et Seibert, 2013; Fang et al., 2015).
1.1.6 Technique d'ajustement guantile-guantile
1.1.6.1 Principe général
·Le principe de base de la technique Q-Q est de corriger les biais dans l'ensemble du comportement distributif d'une simulation climatique (Wood et al., 2004; Boé et al., 2007; Déqué, 2007). Essentiellement, le n-ième quantile de la distribution simulée est ajusté au n-ième quantile de la distribution d'un produit de référence, tel qu'illustré sur la Figure 1.1. La fonction de transfert est définie pour une période dite de calibration ou de référence, et est ensuite appliquée à 1' ensemble de la simulation.
L'ajustement distributif de la technique Q-Q corrige conjointement les différences
liées à la disparité d'échelle et celles liées aux biais de la simulation. Le produit de référence, généralement des observations in situ ou une ré-analyse, peut lui aussi comporter des biais par rapport à la réalité, si bien que son choix est important.
La technique Q-Q est largement utilisée en raison de sa capacité à gérer les moments
d'ordre supérieur, de sa simplicité sur le plan informatique (Wood et al., 2004; Piani et al., 2010; ThemeBI et al., 2011; Gudmundsson et al., 2012; Teutschbein et Seibert, 2013) et surtout de sa bonne performance lorsque la correction est faite sur une seule
variable (Raty et al., 2014; Fang et al., 2015; Teng et al., 2015). La technique Q-Q,
comme toutes les techniques d'ajustement statistique, suppose que les biais par
rapport aux observations historiques seront constants dans le temps. La technique
Q-Q
ait été largement utilisée pour générer des scénarios de précipitations et detempérature moyenne mensuelles (Hayhoe et al., 2008; Maurer et Duffy, 2005; Wood
et al., 2004), et son adaptation aux données journalières est relativement récente
(Abatzoglou et Brown, 2012; Maurer et al., 2010). L'impact de la technique Q-Q sur
montré sur la Figure 1.2. Tous les choix de paramètres/options pour cette figure seront précisés plus loin.
1.1.6.2 Les options
On distingue dans la littérature deux catégories d'application de la technique Q-Q : l'application non-paramétrique (e.g. Wood et al., 2002) et l'application paramétrique (e.g. Piani et al., 2010a). Il existe deux options principales dans la procédure de la technique Q-Q non-paramétrique (Hempel et al., 2013; Gennaretti et al., 2015; Zhao et al., 2017). La première option réside dans la préservation ou non de la tendance à
long terme des simulations. La seconde option est quant à elle liée au nombre de fonctions de transfert (dénotée FQM); on peut post-traiter avec une seule FQM (valable toute l'année) (p. ex. :Reiter et al., 2015), avec 4 (une pour chaque saison de l'année) (p. ex. : Maraun, 2012), avec 12 (une pour chaque mois) (p. ex. : Haerter et al., 2011) ou avec 365 (une pour chaque jour de l'année) (p. ex. : Themessl et al., 2011). Dans ce dernier cas, il faut sélectionner une largeur de fenêtre mobile (LFM
=
2D+ 1, où D est le nombre de jours avant et après le jour de l'année à post-traiter) (voir figure 1.3). Dans la littérature, la valeur de la LFM varie d'une étude à l'autre. Par exemple, Abatzoglou et al. (2012) ont travaillé avec LFM = 15 jours, Thrasher et al. (2012) avec LFM=
31 jours, Gennaretti et al. (20 15) avec LFM=
41 jours, et Rajczak et al. (2016) avec LFM = 91 jours. La FQM spécifique à chaque jour de l'année présente un avantage par rapport à la F QM spécifique à chaque mois (ou spécifique à chaque saison), à savoir éviter les discontinuités climatologiques aux transitions de mois en mois (ou de saison en saison) (Gennaretti et al., 2015). Pour cette raison, les FQMspécifiques à chaque jour de l'année sont utilisées dans cette étude. Une formulation mathématique et les détails techniques de ces deux options dans la procédure de la technique Q-Q non-paramétrique sont présentés dans 1 'Appendice A du mémoire.
La technique Q-Q, qui n'est pas basée sur des relations inter-variables de nature physique, a aussi des limites (Wilcke et al., 2013; Hewitson et al., 2014; Addor et Seibert, 2014). L'une de ces limites peut être révélée par la possibilité de la technique Q-Q de générer des situations d'incohérence physique (IP). On peut distinguer deux types de problèmes d'IP pouvant potentiellement être générées (Grenier, 2017): 1) le type 1 réfère à l'attribution d'une valeur impossible à une variable, et 2) le type 2 réfère à la brisure d'une relation inter-variable fixe. À titre illustratif, on peut citer pour le type 1 des situations avec des humidités relatives (HR) plus grandes que 1 00%; et pour le type 2 des situations où 1 'humidité relative ne serait plus cohérente avec ses variables parentes, qui sont la température, la pression et 1 'humidité spécifique (Grenier, 2017). Un autre exemple d'IP de type 2 est la génération de situations où T min> T max, correspondant à un écart thermique journalier (ET J
=
T max-Tmin) négatif dans les scénarios climatiques (Thrashe·r et al., 2012). On peut éviter ou minimiser ces IP en forçant la méthode de post-traitement à respecter minimalement la physique. Cela peut être mis en œuvre 1) en plafonnant aux seuils adéquats (p.ex. une valeur HR = 115 % serait ramenée à HR = 100 %), et/ou 2) en calibrant les
paramètres/options de la technique Q-Q pour minimiser la fréquence d'occurrence
des valeurs (ou ensembles de valeurs) impossibles, et/ou en déduisant un certain nombre de variables des autres, dans le cas où des relations mathématiques existent
entre celles-ci. Une mise en évidence du problème des ETJ négatifs pour un point.de
grille de notre région d'étude (Baie d'Hudson) est présentée sur la Figure 1.4.
1.2 Les objectifs de l'étude
Cette étude se concentre sur le problème de génération de situations des ETJ négatifs. Dans une étude récente, Thrasher et al. (2012) ont montré que, pour les points de grille terrestre de 17 simulations, la technique Q-Q peut générer des situations des ETJ négatifs pour certains jours. Ils ont remarqué que le problème peut être généré dans n'importe quelle région de la Terre, ce qui est illustré sur la Figure 1.5. Les
auteurs ont lié statistiquement ce problème aux biais des MGC dans la rétroaction de l'albédo de la neige pendant la période de fonte des neiges. Pour résoudre le problème des ETJ négatifs, Thrasher et al. (2012) ont étudié deux alternatives : l'alternative 1 consiste à faire le post-traitement statistique de ETJ et de Tmax par la technique Q-Q, puis de déduire Tmin; l'alternative 2 consiste à post-traiter les ETJ et Tmin, puis déduire
Tmax· L'inconvénient de cette stratégie est que la variable déduite perd une partie de l'équivalence statistique (avec le produit de référence) qu'elle aurait acquise si elle avait été directement post-traitée. Dans ce mémoire, la recommandation de Thrasher et al. (2012) est désignée par la recommandation Th2012. Une nouveauté conceptuelle du présent mémoire consiste à aussi étudier une troisième alternative dans laquelle DTR ainsi que la moyenne de Tmin et Tmax sont post-traitées, puis Tminet Tmax sont ensuite toutes deux déduites.
1.2.1 Questions de recherche
À la lumière des résultats de Thrasher et al. (2012), certaines questions scientifiques peuvent être ·posées, et ont motivé cette étude: (i) y a-t-il génération de situations d' ETJ négatifs par la technique Q-Q pour une région maritime (ici la Baie d'Hudson)? Et quelle en serait la fréquence?; (ii) entre les deux alternatives de la recommandation de Th2012, laquelle est plus efficace? C'est-à-dire laquelle remédie au problème avec la plus faible perte en équivalence statistique?; (iii) Ne serait-il pas possible de remédier au problème d'incohérence physique en ajustant simplement les options et les paramètres de la technique Q-Q sans forcément recourir aux alternatives de la recommandation de Th2012?; (iv) La troisième alternative présentée ci-haut est-elle meilleure que celles étudiées par Th2012?
1.2.2 Objectifs spécifiques
Dans ce travail, nous complémentons le travail de Thrasher et al. (20 12), en caractérisant la génération des situations d'ETJ négatif par la technique Q-Q
univariée, et en inter-comparant plusieurs alternatives pour éviter le problème sur la zone marine de la Baie d'Hudson. Les objectifs spécifiques sont les suivants : 1) étudier les conditions dans lesquelles les valeurs de ETJ négatif sont générées, 2) analyser l'impact de l'option de préserver la tendance à long terme des simulations et du paramètre de la LFM de la technique Q-Q sur la Foü des ETJ négatifs générés, 3) inter-comparer trois alternatives permettant d'éviter le problème d'incohérence physique selon leur perte en équivalence statistique avec le produit de référence, 4) étudier le lien potentiel entre la perturbation de la tendance simulée (par Q-Q) et la fréquence d'occurrence (Foü) des ETJ négatifs, et 5) étudier la relation potentielle entre d'une part la Foü des ETJ négatifs et d'autre part les biais dans les concentrations de glace de mer (CGM) et dans les ETJ simulés.
1.3 Région d'étude
1.3.1 Climat général de la Baie d'Hudson
La Baie d'Hudson située dans le nord-est du Canada, avec une superficie d'environ 1 ,23 million km2. Cette région marine est saisonnièrement englacée et joue un rôle important dans la variabilité climatique régionale du Canada (Maxwell, 1986). Dans le sud de cette région, la formation de glace de mer commence vers la fin du mois d'octobre et prend fin en été (Gagnon et Gough, 2005; Gagnon et Gough, 2006). Cette présence saisonnière de glace est un facteur clé qui affecte l'équilibre énergétique de la région, à cause du mécanisme de rétroaction lié à son albédo (Curry,
1995; Perovich et al., 2002; Li et al., 2006). Les valeurs de l'albédo de sa surface peuvent varier autour de 0.8 à 0.9 pour la glace couverte de neige fraîche et être d'environ 0.5 pendant la fonte des glaces et sont même sensiblement plus faib.les si la glace devient très mince (Laine, 2004). Dans la Baie d'Hudson, la température de l'air près de la surface varie généralement -30 et -10 o C en hiver et entre 0 et 12 o C en été en raison de l'afflux d'eau douce (Gagné, 2006). Le climat de la Baie d'Hudson a
fortement changé au cours des dernières décennies (ACIA, 2005). En effet, la durée de la saison libre de glace y a considérablement augmenté depuis 1980, avec la fonte des glaces plus hâtive au printemps et un englacement prenant place plus tard en automne (Andrews et al., 2016). Le réchauffement observé de 2000 à 2009 dans cette région est environ le double du taux de réchauffement global moyen (IPCC, 2007; Richter-Menge et Jeffries, 2011). L'augmentation de la température est simultanée avec un déclin rapide de l'étendue de glace ati cours des dernières décennies (Comiso et al., 2008; Stroeve et al., 2012).
1.3.2 Importance de l'information climatique pour la Baie d'Hudson
La Baie d'Hudson comporte de nombreuses interactions avec les régions situées plus au sud (Silicani, 2007), c'est-à-dire qu'elle n'est pas une région isolée du reste de la planète, et les changements qu'elle subit actuellement auront aussi des impacts pour tout le système climatique global. Ainsi, fournir de l'information et des services climatiques dans cette région est un défi environnemental et sociétal de grande ampleur à plusieurs niveaux. Tout d'abord, la caractérisation du climat actuel de la Baie d'Hudson est plus difficile que pour les latitudes moyennes en raison du déficit de réseaux d'observation et des grandes différences observées entre le climat historique découlant des données de ré-analyse disponibles et des ensembles de données simulées (Drobot et al., 2006; Eum et al., 2014; Rapaic et al., 2015). Deuxièmement, il existe une large incertitude dans l'ampleur et le moment du signal de changement climatique simulé dans cette région en raison de la complexité des processus et des rétroactions impliqués dans les modèles climatiques. Par exemple, la couverture de glace de mer, les rétroactions d'al.bédo de neige et de glace, les inversions de température de surface et le pergélisol sont des éléments clés du système climatique de la Baie d'Hudson qui ne sont pas bien simulés même par les MRC et les MGC les plus avancés (Stroeve et al., 2012; Qu et Hall 2014). Troisièmement, il est important de mieux comprendre et évaluer les changements qui
s'y produisent et par ricochet d'appréhender l'ampleur de leur effet sur le système climatique global.
1.4 Structure du mémoire
Le mémoire est organisé comme suit. Le chapitre 2 contient un article scientifique rédigé en anglais sur les objectifs spécifiques 1, 2 et 3. La section 2.1 présente le contexte scientifique et les motivations. La section 2.2 décrit les données utilisées ainsi que la méthodologie d'investigations utilisées. La section 2.3 présente les résultats. La section 2.4 résume les résultats et conclure, ce qui va clore l'article scientifique en anglais. Les objectifs 4 et 5 sont discutés dans le chapitre 3, aussi rédigé en anglais. Les principales conclusions de 1' étude sont résumées en français dans le chapitre 4. Le mémoire se termine par avec l'Appendice A, qui montre en détaille développement mathématique de la technique Q-Q.
100 --+-SIM --+-CFSR 90 80 70 60 ~ ~ Q) 50 ü (jj a.. 40 30 20 10 0 -50 -40 -30 -20 -10 0 10 T [OC] max
Figure 1.1 : Fonction de distribution cumulative des températures journalières
maximales (Tmax) pour 1979-2010 et le point de grille (60.41 o N, -78.75 °E),
correspondante à la simulation SIM-14 (rouge) et au produit de référence CFSR (noir). Les points montrent, pour chaque distribution, les centiles 0, 1, 3, 5, ... 97, 99,
20 10
ü
0 '2... >< <Il E -10 1---20 -30 20 10ü
0 '2... c .Ë -10 1---20 -30 0 a) b) 50 100 150 200 250Day of the year
- -sim - - CFSR - -QM - -sim CFSR - -QM 300 350
Figure 1.2 : Cycle annuel des températures minimales et maximales journalières (Tm;n et Tmax) pour 1979-2010 et le point de grille (59.16° N, -94.06 °E), correspondant respectivement à la simulation SIM-09 (rouge), aux scénarios (vert), et au produit de référence CFSR (noir); (panel, a) cas des températures minimales journalières (Tm;n); et (panel, b) cas des températures maximales journalières (Tmax).
k
k
+
l
séries
t
e
m
pore
R
e
s
s
imu
l
ées
k+Hlk
+n
1séries
.
l
+
l
t
empore
ll
es
·
obse
rvées
l
+
m
Figure 1.1 : Schématisation de la technique de sélection de la largeur de la fenêtre mobile (LFM = 2D+ 1), avec D correspondant au nombre de jour avant et après le jour
de l'année à post-traiter. TI est nécessaire que: l;;::: k et m:::; n; c'est-à-dire que 1' étendue temporelle de la série observée utilisée pour calibrer la simulation soit couverte par l'étendue temporelle de cette simulation.
30
•
ETJTh12 >0•
ET J Th12 <0•
•
25•
..
• • •
•
•
••
~,
•
•
20••
•
•
15a:
•
IT••
'L.•
•
C\J•
:E 10 r-~ ·-UJ 5 0 -10L---~----~---~---L----~~----~----~----~ 0 5 10 15 20 25 30 35 40 ETJSIMf'CJ
Figure 1.4 : Écart thermique journalier (ET]Th12
) déduit des températures minimales
et maximales journalières post-traitées pour la période 1979-2010, la simulation SIM
MRI-CGCM2.3.2A: Run 3
~c=
~
. .
--
--
~
~
~
==
==
..
0 92 183 275 367 458
Figure 1.5 : Spatialisation du nombre d'occurrence d'ETJ négatif pour la période 1981-1999, avec un maximum à 520 cas. Reproduction de la Figure 1 de Thrasher et al. (2012).
--CHARACTERIZA TION OF PHYSICAL INCONSISTENCY GENERA TED BY UNIV ARIA TE QUANTILE MAPPING OF DAIL Y TEMPERA TURE EXTREMA :
A CASE STUDY OVER HUDSON BA Y
Characterizing and avoiding physical inconsistency generated by univariate quantile mapping of daily temperature extrema: a case study over Hudson Bay
Name and affiliation of each author:
Médard Noukpo Agbazo1 and Patrick Grenier1
•2
1
Centre pour l'Étude et la Simulation du Climat à l'Échelle Régionale (ESCER), Université du Québec à Montréal (UQAM), Montréal, Canada
2
Climate scenarios and services Department, Ouranos, Montréal, Canada
Corresponding author address and e-mail:
Patrick Grenier
550, Sherbrooke West Street, 19th Floor, Montreal (QC), H3A 1B9, Canada
Abstract
Univariate quantile mapping (QM) may generate a problem of physical inconsistency (PI) between Tmin and Tmax, corresponding to situations where Tmin > Tmax· To remedy this PI, sorne authors have introduced the idea to instead post-process DTRsim and T;,,.i'::;, and deduce Tm;n afterwards (alternative 1), or vice versa (alternative 2); alternative 1 was recommended as the best approach. The main objective here is to study this recommendation for the region of Hudson Bay. Specifie objectives are: to investigate the conditions under which PI situations are generated; to study the impact of different nurnerical choices of the QM technique on the generation of PI; and to intercompare different alternative statistical post-processing approaches. Results show that: the PI situations appear preferentially for the small values of DTRsim, but the differentiai between the respective biases of Tmin and Tmax also plays an important role; one cannot completely remedy the generation of PI situations simply by adjusting parameters and options of QM, but forcing preservation of the simulated trend generates fewer PI situations; alternative 1 is the best overall.
2.1 Introduction
Global and regional climate models (GCMs and RCMs) simulate the climate system by considering as many physical, chemical and biological phenomena as permitted by current knowledge and computational power. On the one hand, nurnerical models are the best tools available for futures studies involving climate information (Flato et al.,
20 13). On the other hand, their formulation does not correspond exactly to the 1aws of the natural world (Petersen, 2000; Grame1sberger, 2011); this is known a priori considering for examp1e discretization, parameterization and incompletion limitations (Müller et al., 2010), and verified a posteriori by considering deficiencies in representing emergent phenomena like ENSO and monsoons (Bellenger et al., 2013; Kerrie et al., 2013) as weil as biases in local climates (Maraun et al., 2017).
Users of climate services often need to reason with plausible climate scenanos (Meams et al., 2001; Hewitson et al. 2014), which arguably correspond to trajectories statistically equivalent with observations over a relatively long period and having a physically-based future long-term trend (Gennaretti et al., 2015). For achieving this, it is often necessary to perform statistical post-processing (SPP) of mode! simulations (e.g. Teutschbein and Seibert, 2012; Wilcke et al., 2013; Hempel et al., 2013; Cannon,
2016), i.e. to include them in a larger reasoning that considers both their added-value and limits as weil as other pieces of information like in situ observations or other observation-based products.
Unfortunate1y, SPP, a procedure generally devoid of physics-based considerations,
also has its limits. One particular problem is that SPP applied in univariate mode can potentially create situations ofphysical inconsistency between variables. For example,
Thrasher et al. (2012) (hereafter referred to as Th2012) showed that quantile mapping (QM), one widely used SPP technique, has the potential for generating situations where daily minimal temperature is higher than daily maximal temperature (Tmin >
Tmax), corresponding to a negative diurnal temperature range (DTR
=
Tmax- Tm;n). To remedy the problem, Th2012 have proposed to deduce one daily temperature extremum after the other extremum and DTR have been post-processed, at the cost of a loss in statistical equivalence with the reference product for the deduced variable. In a related study, Grenier (2017) classified SPP-induced physical inconsistency into two types, namely single-variable inconsistency (type 1, occurring when a variable is attributed an impossible value) and inter-variable inconsistency (type 2, when a set of variables is attributed values that are collectively impossible).This paper complements the study ofTh2012 on physical inconsistency (Pl) of type 2 between Tmin and Tmax· The present study differs from that ofTh2012 mostly by being based on a larger ensemble of simulations (83 instead of 17), by applying to another type of domain (maritime instead of terrestrial), and by intercomparing more
alternative SPP approaches for the avoidance of the PI problem (3 instead of 2). Specifie objectives are: 1) to investigate the conditions under which negative DTR situations are generated, 2) to study the impact of different numerical choices of the QM technique on the generation of negative DTR, and 3) to intercompare the three alternative SPP approaches in terms of loss of statistica1 equivalence with the reference product.
The paper is structured as follows: Section 2.2 describes the data sets and methods involved in the paper. Results are presented and interpreted in Section 2.3. A summary with concluding remarks forms Section 2.4. The appendix contains the list of acronyms used in this study.
2.2 Data sets and methods
2.2.1 Data sets
Constructing a climate scenario with quantite mapping (QM) basically involves two pieces of information, nam~ly a climate simulation that provides a sequence of meteorological events and a long-term trend, and a reference product for calibrating the simulated distribution during a chosen reference period.
2.2.1.1 Reference product
The Climate Forecast System Reanalysis (CFSR; Saha et al., 2010) is chosen here as the reference product. This product has an hourly frequency and covers the period 1979-2010, allowing for a 32-year calibration period. The minimum and maximum of the 24 daily values for the field 'tas' (air temperature at 2 meters) are interpreted as
T min and T max, respective! y. Figure 2.1 represents the CFSR ocean grid til es of the
Hudson Bay area; calculations are performed only for the 1036 grid til es appearing in red; grid tiles appearing in blue have been discarded because at 1east one of the
simulations used (see Section 2.2.1.2) has a corresponding grid tile of land type. The CFSR data set is of course not an exact representation of the reality ( e.g. Ebisuzaki and Zhang, 2011), particularly in the Canadian Arctic (Rapaié et al., 2015). This is a limitation, but in the absence of a single best reference product for this region (Diaconescu et al., 2017), using a typical one is reasonable.
2.2.1.2 Climate simulation data
In this study, 83 simulations from the Coupled Model lnter-comparison Project phase 5 (CMIP5; Taylor et al., 2011) are used. These are identified in Table 2.1 (modelling center, model name and version, number of member, and representative concentration pathway- RCP). The simulations differ in the horizontal resolution oftheir grids. For each of the 1036 investigated CFSR grid tiles, daily Tmin and Tmax values of the simulation grid tile with the closest center are considered. Simulations are post-processed for the period 1979-2100, which includes, in terms of CMIP5 experiments, an historical segment (1979-2005) and an RCP segment (2006-21 00).
2.2.2 Methods
This section describes the quantile mapping (QM) technique, and presents the different statistical post-processing (SPP) approaches (the ways to use QM) as weil as the nomenclature for ali variables involved in this paper. This section also presents the investigation methods for characterizing the physical incori.sistency (Pl) problem generated by the base SPP approach (directly post-processing both Tmin and Tmax) and for comparing the three alternative SPP approaches used to avoid the PI problem.
2. 2. 2.1 Quantite mapping
The SPP technique used here is univariate quantile mapping (QM). This technique is commonly used in climate services, under different variants and names (e.g. Déqué,
2007; Piani et al., 2010; Gudmundsson et al., 2012; Raisanen and Raty, 2012; ThemeBl et al., 2012; Cannon et al., 2015; Fang et al., 2015). The central idea ofQM is to bui1d one or a set of transfer function(s) FQM describing the quantile-specific mismatch between simulated and observed distributions during the calibration period,
and then to apply FQM to the whole simulation. Because QM has been described several times in the literature, we re fer to Gennaretti et al. (20 15) for the technical details, and discuss only the choices (one option and one parameter) that are varied in this study.
One important option is the forcing (or not) of the preservation of the simulated long-term trend (Hempel et al., 2013; Zhao et al., 2017). Indeed, FQM can be defined by comparing directly the reference and simulated distributions (during the calibration period), or by comparing residuals after long-term trends have been removed (e.g. fourth-order polynomials, which are added back after application of the transfer functions on the residuals of the whole simulation). Another option is the number of transfer function(s); one can work with only one FQM (valid year-round) (Reiter et al.,
2015), with 4 (for each season-of-the-year- SoY) (Maraun, 2012), with 12 (for each month-of-the-year- MoY) (Haerter et al., 2011) or with 365 (for each day-of-the-year - Do Y) (Themessl et al., 2011). In the latter case, one must select a width (W)
for a moving window around the Do Y to be post-processed. For example, Abatzoglou et al. (20 12) worked with W
=
15 da ys, Thrasher et al. (20 12) with W = 31 da ys,Gennaretti et al. (2015) with W= 41 days, and Rajczak et al. (2016) with W= 91 days. DoY-specific FQM presents an advantage over MoY-specifie and SoY-specific FQM, namely the avoidance of climatological discontinuities at month-to-month or season-to-season transitions (Gennaretti et al., 2015). For this reason, Do Y-specifie FQM are used in this study.
In this section, all variables involved in the basic approach (directly post-processing
Tm;n and Tmax) and in the three alternative approaches are defined. Any superscript
used for a quantity T (temperature) or DTR (diurnal temperature range) refers either
to its source data set ('cfsr' for the reference product or 'sim' for a simulation) orto
the way it is obtained ('qm' for direct post-processing, 'alti' for the deduced variable
Tm;nin alternative 1, 'alt2' for the deduced variable Tmaxin alternative 2, 'alt3' for the deduced variables Tm;n and Tmax in alternative 3, and 'basic' for the deduced variable
DTR when Tmin and Tmax are directly post-processed). A lack of subscript means one
refers to sorne variable in general. Subscripts are only used with T, for referring to a
specifie daily temperature indicator. Table 2.2 consists of a synthesis of the variables involved in the different SPP approaches.
A general strate gy to a void the generation of physical inconsistency (PI) between T min
and T max is to post-process a set of variables for which PI cannot be generated and
from which Tm;n and/or Tmax can be deduced. Two alternatives of this strategy have
already been investigated by Th2012, using DTR defined as:
DTR
=
Tmax- Tm;n (eq. 1)The fust one, referred to here as alternative 1, consists in directly post-processing
DTRsim and T.,;f:Ji (to obtain DTRqm and T:ft:X, respectively), and next deducing T!~t.; using the relationship:
(eq. 2)
The second one, referred to here as alternative 2, is the opposite of alternative 1,
namely to directly post-process DTRsim and T.;{J:: (to obtain DTRqm and T.!7:t ,
ratt2 = Tq~ + DTRqm
max mLn (eq. 3)
Another alternative, not investigated by Th2012 and referred to here as alternative 3,
consists in post-processing DTRsim and the variable T~~~Y defined as:
Tsim :::: (Tsi!'t hway mm
+
Tsim) max 1 2 (eq. 4)The variable Thway corresponds with the temperature halfway between Tm;n and Tmax,
and is not necessarily equal to the daily temperature average, because sub-daily warming and cooling rates may differ (Zeng and Wang, 2012). After post-processed values for DTRqm and
r:::a_Y
are obtained, they are used to deducer:;,y.;
and T~~ using the relationships:Tan3 = Tqm - DTRqm 1 2
mm hway
ratt3 = Tqm max· hway + DTRqm 1 2
(eq. 5) (eq. 6)
Alternatives 1, 2 and 3 thus consist in creating scenarios (post-processed simulations)
d f th · f · bl rattt d Tqm Tqm d ratt2 d Tatt3 d ratt3
ma e o e pairs o vana es min an max• min an max, an min an max, respectively. A priori, the distribution of a deduced variable is not expected to be statistically equivalent to that obtained from the direct application of QM ( e.g. r:,_~~1 ~
T.!7:t),
and consequently not expected to be statistically equivalent to the reference product in terms of distributions ( e.g. { r:,_~~1} ~{ T~~r}).lt is important to note that DTRsim is post-processed using multiplicative F QM (by design, this cannot lead to negative DTRqm values, which is the key aspect that
guarantees the alternatives do avoid physical inconsistency between T min and T max),
whereas additive FoM are used for T;1[;;, T;,t;:; and T~~~y·
2.2.2.3 Investigation methods 2.2.2.3.1 Factors o(risk
The investigation starts with an attempt to understand how a negative DTR situation may be generated from the application ofunivariate QM on consistent T;1[;; and T~/:ic values. A priori, two factors can be thought to increase that risk: 1) the initial DTRsim value being very small, and 2) a differentiai between T;1{;{ and T,hi:ic biases leading T-!7:t to exceed T!:X . The simple following formalism aims at partaking the responsibility of the generation of negative DTR between these two factors. In model outputs, each day is characterized with:
DTRsim = - r,sim _ TSmax mm-!!ft > 0 (eq. 7)
When both T;1[;; and T,hi:ic are post-processed following the basic approach, being altered by their respective corresponding transfer functions FQM(T;1{J;) and FQM(T,hi:ic) (at their respective quantiles), one obtains T!:X and T-!7:t, respectively. The corresponding DTRbasic is then:
DTRbasic
=
- Tqm _ Tqr:'-max mm=
(r,smax im+
F. QM ma(r,sim)) _ (rx mm si!n+
F. QM mm (Tsi!ft)) (eq. 8a) DTRbasic = DTRsim+
(F. QM max (Tsim) _ F. QM mm (Tsi!ft)) (eq. 8b)(eq. 9)
Defining the differentiai (fJQM) between the transfer functions for
r;;r;:
andy.,:.._ï:z;
as:(eq. 10) the condition for negative DTRbasic can be written as:
(eq. 11)
As DTRsim -> 0 ' negative DTRbasic minimally requires that F QM (Tsirn) mm
>
F QM (Tsim) max ·In Section 2.3.1, the condition associated with the factors ofrisk linked with /SQM and
DTRsim is illustrated with a specifie example, and the problem of physical inconsistency with the base approach is characterized by linking the factors of risk with the occurrence of negative DTRbasic.
2.2.2.3.2 Sensitivity to QM variants
The second part of the investigation focusses on the impact of one QM option (trend preservation) and one QM parameter (W) on the generation of negative DTRbasic
values. The objective is to explore whether there are QM variants that e1iminate or strongly limit the generation of physical inconsistency. The different variants are referred to for example as QM(forced, 31) or QM(free, 91), where the first (dichotomous) argument refers to forcing (forced) or not (free) the preservation of the simulated 1ong-term trend, and the second argument refers to W (the width of the moving window). Due to computationallimitations, calculations for most simulations were performed for only three Wvalues (31, 41, and 91 days), whereas for a subset of
three simulations the calculations were also performed for seven other W values (15, 21, 51, 61, 71, 81 and 181 days).
In Section 2.3.2, frequency of occurrence (FoO) and amplitudes of negative DTRbasic values are characterized by showing the variability across simulations, across the domain, and across RCPs, for different QM variants. The variant minimizing the FoO of negative DTRbasic is then used for the subsequent comparison of the three alternative approaches.
2.2.2.3.3 Loss o(statistical equivalence
By design, univariate QM guarantees that the scenario for each variable (here Tm;n and Tmax) is in statistical equivalence with the reference product over the calibration period (in terms of distribution; numerical details may hinder perfect equivalence).
However, when the scenario for a variable is deduced from other post-processed variables, statistical equivalence may potentially not be met.
This issue is investigated in Section 2.3.3, using the one-dimensional two-sample Kolmogorov-Smimov statistic (DKs) to evaluate the level of statistical equivalence
between on the one hand the direct! y post-processed or deduced extrema from each of the approaches synthesized in Table 2.2 and on the other hand their corresponding reference distribution (either T~~r or r:;[:;). The DKs statistic is a metric that takes as inputs two distributions and retums as an output the largest difference in their cumulative density function, which may vary between 0 (for identical distributions) and 1 (for distributions that do not even overlap) (Wilks 2006). For brevity, the DKs
2.3 Results
2.3.1 Factors ofrisk
Figure 2.2 illustrates the condition (eq. 11) for the generation of negative DTRbasic
values, by presenting bQM and DTRsim values for two Do Y (January 2nd and July 2nd) ( each dot represents one of the 122 years of the application period 1979-21 00). These values correspond with SIM-56, the grid tile centered at 59.16 °N, -88.56 °E, and the QM(free,31) variant. For January 2nd, no bQM value exceeds its corresponding DTRsim
value, hence no negative DTRbasic value is generated even if for sorne days the bias differentiai bQM is positive (blue dots, above the blue line indicating bQM = 0). The situation is different for July 2nd, for which there are 23 years with bQM higher than
DTRsim (red dots, above the red line indicating bQM = DTRsim).
Figure 2.3 shows the number of negative DTRbasic values per 2-dimensional bins for
DTRsim and bQM, per season, for the QM(free,31) variant. Negative DTRbasic
occurrences for all grid tiles and all post-processed simulations are surnmed up. As expected, physical inconsistency occurs preferentially for small DTRsim values (note
the logarithmic-style colorbar), but a few DTRsim values up to 38 °C are replaced by negative DTRbasic values, because the bias differentiai bQM is larger.
2.3.2 Sensitivity to QM variants
Figure 2.4 presents the Foü of negative DTRbasic for each ofthe 83 simulations used, considering all 1036 grid tiles during the period 1979-2100, as obtained with QM(free, 31) (filled circles) and QM(forced, 31) (empty circles). Each panel corresponds with one model (see Table 2.1 ), with the circle col or indicating the RCP (magenta for RCP2.6, green for RCP4.5, blue for RCP6.0, and red for RCP8.5), and the number written on each dot indicating the member (e.g.: "6" stands for CMIP5 code r6i1p1). Results show large variability across models. For fixed model and QM