B.I.2. Contrôles et traitements ... 85
B.I.2.a. Méthode de détection des valeurs aberrantes ... 85
B.I.2.b. Méthode de remplacement/suppression des données ... 87
B.II. ÉTUDE DES ÉVOLUTIONS DE TEMPÉRATURES EN BOURGOGNE ... 89
B.II.1. Recherche de ruptures ou/et de tendances : présentation des outils mobilisés ... 89
B.II.1.a. Test de Mann-Kendall (1945) ... 89
B.II.1.b. Test de Pettitt (1979) ... 89
B.II.1.c. Test de la Split Moving Window Dissimilarity Analysis (1973) ... 89
B.II.2. Évolutions observées ... 90
B.II.2.a. Évolutions des moyennes annuelles ... 90
B.II.2.b. Évolutions saisonnières ... 94
B.II.2.c. Évolutions des fréquences quotidiennes de métriques plus fines ... 96
B.II.3. Nuances infrarégionales ... 99
B.III. SPATIALISATION DES TEMPÉRATURES EN BOURGOGNE : DÉMARCHE ET MÉTHODOLOGIE . 103
B.III.1. Démarche : recherche préalable de structures spatiales récurrentes ... 104
B.III.1.a. Pourquoi une telle approche ? ... 104
B.III.1.b. L'outil de classification utilisé : la Classification Hiérarchique Ascendante (CHA) .... 106
B.III.2. Méthodes d'interpolation ... 108
B.III.2.a. Prise en compte de la morphométrie avec une régression linéaire multiple ... 108
B.III.2.b. Le krigeage ... 109
B.III.2.c. Les splines en plaques minces ... 110
B.IV. Résultats ... 111
B.IV.1. Étude climatique sur la période 1973-2009 ... 111
B.IV.1.a Mise en évidence de structures spatiales de températures (1973-2009) ... 111
B.IV.1.b. Les structures spatiales ... 114
B.IV.1.c. Évolution des fréquences d’occurrence de ces structures... 117
B.IV.2. Spatialisation des températures quotidiennes pour la période 1989-2009 ... 121
B.IV.2.a. Similitudes dans les structures spatiales et élaboration de classes ... 122
B.IV.2.b. Spatialisation par régressions multiples basées sur la morphométrie ... 123
B.IV.2.c. Interprétation des régresseurs ... 126
B.IV.2.d. Interpolations géostatistiques (krigeage) des valeurs résiduelles et distributions
spatiales moyennes des températures de chacune des classes ... 132
B.IV.3. Évaluation et comparaison des méthodes d’interpolations ... 136
B.IV.4. Relation entre les structures thermiques en Bourgogne et les structures d’échelle
synoptique ... 140
Conclusions du chapitre B ... 142
Caractériser la variabilité multi-scalaire des températures est un enjeu important,
à la fois pour mieux appréhender les structures spatiotemporelles de la dynamique du
climat et produire une information adaptée pour les études d'impact dans un
contexte de changement climatique. Si les mesures stationnelles sont
incontournables pour approcher et documenter directement ou indirectement ces
éléments, il est, suivant les situations, difficile de les extrapoler aux espaces non
instrumentés. Malgré de nombreuses études autour de ces questions, la complexité
du travail (nature chaotique et multiples forçages et interactions entre les principaux
compartiments du système climatique) fait qu'il est difficilement envisageable
d'apporter une réponse « unique » à ce type de problème [Joly et al., 2009 ; Joly et
al., 2010 ; Lloyd, 2010 ; Li and Heap, 2011 ; Joly et al., 2012 ; Hengl et al., 2012].
C'est la combinaison de plusieurs aspects (e.g. géographie et extension de la zone
d'étude, grands traits du climat, niveau et qualité de l'instrumentation, variables
d'intérêt et objectifs poursuivis) qui vont conditionner le type d'approche à
développer et/ou mettre en œuvre. Ce chapitre a trois objectifs principaux (Figure
B.1.) : 1/ l’élaboration d’une base de données de températures ponctuelles
(minimales et maximales) quotidiennes sur la région Bourgogne ; 2/ l'analyse des
évolutions de températures selon plusieurs pas de temps : annuel, mensuel et
quotidien ; 3/ la production (et la mise à disposition aux partenaires) de bases de
données en points de grille documentant à la plus haute résolution
possible les températures quotidiennes. Après une brève introduction
rappelant les grands traits du climat en Bourgogne, la première partie présente les
données météorologiques, la deuxième décrit l'évolution des températures, la
troisième décrit la méthodologie et les outils utilisés dans la quatrième partie qui
traite de la spatialisation des températures.
B.I. BASE DE DONNÉES DE TEMPÉRATURES
PONCTUELLES
L’étape initiale est l'élaboration d'une base de données et la vérification de sa
qualité. Il s'agit de s’assurer que les séries couvrent une période suffisante au regard
de la problématique, documentent correctement l'espace étudié et ne contiennent pas
de données aberrantes ou manquantes. Concernant ce dernier point, plusieurs
méthodes de détection et de remplacement de valeurs aberrantes sont utilisées. Au
final, le travail aboutit à la constitution d’une base de données « Température
Bourgogne » couvrant la période 1961-2009.
B.I.1. Données initiales
Les bases de données météorologiques sont issues du réseau de stations
météorologiques de Météo-France. Initialement, elles comportent les données de
températures minimales et maximales quotidiennes pour quatre-vingt-dix stations en
Bourgogne et dans quelques départements limitrophes (Figure B.2., A). La distance
minimale moyenne entre deux stations est d’environ quinze kilomètres (Figure B.2.,
B), les plus proches étant distantes de 2,8 kilomètres et les plus distantes de 37,3
kilomètres.
En comparant la distribution des altitudes du Modèle Numérique de Terrain
(MNT) SRTM (cf. B.III.2.a.) avec celle des altitudes des stations (Figure B.2., C), on
note une sur-représentation des basses altitudes (< 250 m) et une
sous-représentation des altitudes comprises entre trois cents mètres et cinq cents mètres
pour les stations. Enfin, au-delà de six cent cinquante mètres d’altitude, il n’y a plus
de station, alors que le MNT montre des altitudes allant jusqu’à huit cent cinquante
mètres (<0,5 % des altitudes).
La profondeur temporelle est comprise entre 1961 et 2009 (cf. Annexe B.1.).
Chacune des séries d’observations est complète, c'est-à-dire sans donnée manquante,
à partir du moment où elle débute jusqu’à la date où elle se termine. Ces séries de
données peuvent parfois comporter des ruptures non climatiques. Ce problème
intervient lors de changements de matériel, lors de déplacements de la station, etc. Il
n’est pas fondamentalement contraignant lorsque l’on travaille sur les données dans
leur ensemble. À l’inverse, les résultats obtenus sur des études stationnelles peuvent
s’en trouver erronés. Les méthodes de corrections de séries de données ont été
discutées et mises en œuvre dans de précédentes études [Alexandersson et Moberg,
1997 ; Moberg et Alexandersson, 1997 ; Mestre, 2000 ; Caussinus et Mestre, 2004].
Ces corrections sont très lourdes à mettre en œuvre et n’ont pas été réalisées pour
cette thèse.
Il s’avère que certaines séries comportent des valeurs aberrantes (-10°C au lieu de
+10°C ; une virgule mal placée par exemple). Ces valeurs peuvent fausser certains
résultats statistiques et il est important de les identifier et de les corriger. La
prochaine partie traitera de la mise en place d’une méthode de détection et de
correction de ces valeurs aberrantes.
Figure B.2.. A. Répartitions des stations météorologiques et leurs altitudes ; B. Distribution statistique de la distance minimale entre deux stations. La boîte principale représente les 50 % autour de la médiane (trait horizontal épais). Les points représentent les valeurs situées au-delà de +/- 1,58* l’écart interquartile / par la racine carré du nombre de valeurs de la série ; C. Distribution des altitudes du MNT à cinquante mètres pour la région Bourgogne (gris foncé) et du réseau de stations (gris clair).
B.I.2. Contrôles et traitements
B.I.2.A.MÉTHODE DE DÉTECTION DES VALEURS ABERRANTES
De nombreuses méthodes sont utilisées pour détecter les valeurs aberrantes. Elles
reposent globalement toutes sur les mêmes principes : la relation entre le point
aberrant et la distribution spatiotemporelle de la série.
Ici, la détection des valeurs aberrantes s’est faite en deux temps. Dans un premier
temps, toutes les données inférieures à la moyenne moins 0,75 fois l’écart interdécile
quotidien, ou supérieures à la moyenne plus 0,75 fois l’écart interdécile quotidien,
sont repérées. Ces valeurs, extrêmes dans la distribution des données, ne le sont pas
systématiquement spatialement. Par exemple, une station de plus haute altitude
pourrait être beaucoup plus froide que les autres stations, sans que cela soit aberrant.
Ainsi, dans un second temps, les valeurs repérées sont affichées sur une carte des
valeurs quotidiennes. Sur la figure B.3., deux cas de figure sont présentés : le premier
cas (en haut dans la figure B.3.), pour lequel la valeur est en dehors de la distribution
(supérieure à la moyenne plus 0,75 fois l’écart interdécile du jour en question), mais
qui, dans la répartition spatiale, ne présente aucune aberration ; le second cas (en bas
dans la figure B.3.) pour lequel trois valeurs sont considérées comme aberrantes et
qui, dans la répartition spatiale, ne trouvent aucune explication et sont clairement
hors de la distribution spatiale. Ici, il s’agit d’un problème de signe (l’ensemble des
valeurs sont fortement négatives, sauf ces trois-là qui sont fortement positives sans
raison apparente). Ainsi, pour toute valeur repérée dans la distribution, il y a eu
vérification spatiale. Si la valeur est considérée comme aberrante, elle sera remplacée
ou supprimée. C’est ce qui est montré dans la sous-partie suivante.
Figure B.3. Deux cas de valeurs aberrantes repérées dans la distribution des températures : en haut, la valeur détectée n’est pas spatialement aberrante ; en bas, les trois valeurs sont spatialement aberrantes.
B.I.2.B.MÉTHODE DE REMPLACEMENT/SUPPRESSION DES DONNÉES
Pour cinq séries, le taux de valeurs aberrantes était trop important : elles ont été
supprimées de la base de données qui comporte désormais quatre-vingt-cinq séries.
Le taux de données aberrantes dans les autres séries, inférieur à 1 % par série, nous
permet de les remplacer sans modifier de façon drastique les caractéristiques de la
série. Pour remplacer la valeur, celle-ci est ôtée du jeu de données puis remplacée par
la valeur interpolée aux coordonnées de la station. La méthode d’interpolation
retenue pour reconstruire les séries est la méthode des splines en plaque mince
[Hijmans et al., 2005 ; Li and Heap, 2011 – cf. chapitre B.III.2.c.]. Cette méthode a
été choisie car elle est celle qui minimise au mieux l’erreur quadratique moyenne
(RMSE) entre la valeur observée et celle estimée (Tableau et encadré B.1.).
Au total, deux cent quatre-vingt-huit valeurs pour les Tn et sept cent quarante-six
valeurs pour les Tx ont été corrigées, soit 0.06 % de la base de données initiale. Une
base de données «Température Bourgogne» a été créée, comportant sept fichiers : les
données brutes (Tn et Tx), les données avec outliers (Tn et Tx), les données corrigées
(Tn et Tx) et les coordonnées/altitudes des stations d’observations.
Tableau B.1. Erreur quadratique moyenne pour différentes méthodes de remplacements de données aberrantes. L’encadré explique la méthode utilisée pour estimer l’erreur de chaque méthode.
Les six fichiers de données, au format texte (.txt), se présentent de la façon
suivante : en colonne, le numéro du poste climatique, l'année d'enregistrement puis
les trois cent soixante-cinq jours de l'année (notons que les 29 février ont
systématiquement été supprimés), le tout classé en ligne, par les années, puis par les
numéros de stations. Les températures sont exprimées en degrés Celsius.
Pour s'assurer que les séries issues des stations sont cohérentes entre elles, chaque
série a été comparée aux quatre-vingt-quatre autres séries (Figure B.4.). Toutes les
valeurs de r² sont supérieures à 0.8, ce qui signe une très forte cohérence temporelle
entre les séries. À noter que cette corrélation est portée par le cycle annuel.
Figure B.4. Distribution statistique des corrélations entre les quatre-vingt-cinq stations (~7 000 comparaisons).