• Aucun résultat trouvé

1.4 Les méthodes statistiques

1.4.1 Les événements de très longs épisodes secs : détection

1.4.1.3 Classification en principales configurations

Une Classification Ascendante Hiérarchique (CAH) est appliquée aux 76 eTLES précédemment détectés. La méthode de la CAH est présentée dans la section 1.4.5.1. Compte tenu de la différence de durée de chaque eTLES, appliquer la CAH à partir de la totalité des 4 423 jours affectés par un eTLES biaiserait les résultats. En effet, les eTLES les plus longs seraient de fait sur-représentés par rapport aux plus courts. De plus, cette approche ne privilégierait pas l’aspect "événementiel" des eTLES. Chaque eTLES est donc représenté par un seul jour le plus représentatif possible de l’épisode.

Ainsi, le jour médian de chacun des 76 eTLES est retenu pour la CAH. Le jour médian correspond à la date se trouvant au milieu de la période affec-tée par l’eTLES. Par exemple, pour l’eTLES n 10 (événement complexe, qui affecte 3 secteurs distincts), le premier jour affecté par l’événement est le 15 décembre 1963 (le premier secteur affecté par l’eTLES est le nord du Levant et le sud de l’Anatolie). Le dernier jour affecté par l’eTLES n 10 est le 28 janvier 1964 (le dernier secteur affecté correspond aux Balkans). Le jour médian de l’eTLES n 10 est le 6 janvier 1964 (figure 1.20a, 1.20b). Le 6 janvier 1964 se trouve à mi-chemin entre le 15 décembre 1963 et le 28 janvier 1964. Basé sur le même principe, le jour médian de l’eTLES com-plexe n 55 est le 3 mars 1998 (figure 1.20c, 1.20d).

Figure1.20 – Deux exemples d’eTLES complexes, affectant simultanément

plusieurs secteurs distincts (l’eTLES n 10, affectant 3 secteurs et l’eTLES n 55, affectant 2 secteurs). La figure 1.20a (1.20c) présente la durée de l’eTLES n 10 (n 55) et le jour médian (ligne verticale en pointillés) de la période couverte par l’événement. Les figures 1.20b et 1.20d montrent la représentation spatiale des secteurs affectés durant le jour médian de chacun des deux événements (sous forme de matrice binaire). Les 4 343 points de grille avec de la donnée apparaissent en gris, lorsqu’ils ne sont pas concernés par un eTLES, ou en couleur, lorsqu’ils le sont. En blanc, tous les points de grille E-OBS qui n’ont pas de données de précipitations.

Un test est réalisé pour être certain que le jour médian de chacun des 76 eTLES soit suffisamment représentatif de l’extension maximale de cha-cun des événements. Pour chacha-cun des 76 eTLES, on compare le nombre de

points de grille affectés par l’eTLES lors du jour médian avec le nombre maximum de points de grille affectés durant l’événement. Si le résultat est de 100 %, cela veut dire que pour cet eTLES, le jour médian correspond à l’extension maximale de l’événement (le nombre de points de grille maxi-mum codés en "1"). Autrement dit, le jour médian est celui de l’extension maximale de l’événement. Si le résultat est de 90 %, cela signifie que pour cet eTLES, le jour médian est associé à un nombre de points de grille af-fectés qui représente 90 % du nombre maximal observé durant l’eTLES. La figure 1.21 montre que pour 50 des 76 eTLES (65 % des eTLES), le jour médian représente 100 % de l’extension maximale de l’événement. Pour 68 eTLES (89 % des eTLES), le jour médian représente au moins 90 % de l’extension maximale de l’événement. En définitive, le jour médian n’est pas vraiment représentatif de l’extension maximale pour seulement deux eTLES complexes (le n 28 et le n 74), pour lesquels trois secteurs dis-tincts sont respectivement impactés par l’événement. Ainsi, pour chacun des 76 eTLES, le jour médian est bel et bien représentatif de l’extension spatiale maximale des événements.

Figure 1.21 – Part de l’extension spatiale maximale représentée par les

jours médians de chaque eTLES (en % de points de grille par rapport au nombre maximal de points de grille affectés durant l’épisode). Les 76 cases représentent les 76 eTLES. La case est rouge lorsque le jour médian est associé à 100 % de l’extension maximale de l’événement ; orange entre 90 % et 99 % ; jaune entre 80 % et 89 % ; verte entre 70 % et 79 % ; bleue moins de 70 %. Les encadrés en noir, avec un chiffre 2 ou 3 à l’intérieur, représentent les 20 eTLES complexes. Le chiffre 2 ou 3 renseigne le nombre de secteurs distincts impactés par l’eTLES.

Pour détecter les principales configurations d’eTLES, l’algorithme de CAH (utilisant la métrique de la distance euclidienne) est alors appliqué à la matrice binaire (définie dans la section 1.4.1.2) des jours médians de chacun des 76 événements (soit sur 76 jours). Lorsqu’on utilise une mé-thode de classification, le choix de la meilleure partition est un problème récurrent, se basant parfois même sur la subjectivité, qui est généralement dictée par l’expérience des chercheurs (Gong et Richman, 1995). Objective-ment, une classification a pour but de maximiser la variance interclasse et de minimiser la variance intraclasse. D’après le dendrogramme et l’inertie du dendrogramme (figure 1.22a et figure 1.22b, le premier découpage qui montre une faible variabilité intraclasse est un découpage en 4 classes. La figure 1.22c montre que pour 4 classes, la variance interclasse explique une part importante de la variance locale des eTLES dans le bassin méditerra-néen, avec trois secteurs qui ressortent : la Péninsule Ibérique, les Balkans et le Levant. Une classification basée sur 5, 6, 7 ou 8 classes entraine des re-dondances dans la géographie des différentes configurations d’eTLES, pour au moins deux classes. De ce fait, la décision finale de garder 4 classes, représentant les principales configurations d’eTLES dans le bassin méditer-ranéen, se base autant sur des arguments quantitatifs, souvent utilisés dans les analyses en classes, que sur la pertinence des différentes configurations spatiales issues de la classification.

Figure 1.22 – (a) Dendrogramme de la Classification Ascendante

Hiérar-chique (CAH) sur les 76 jours médians des eTLES. Le nombre de branches du dendrogramme correspond au nombre de classes. (b) Inertie du dendro-gramme de la CAH (nombre de classes entre 2 et 10). Dans le graphique, pour un nombre de classes données, une grande distance euclidienne singni-fie que la variance intra-classe est grande. À l’inverse, une faible distance euclidienne signifie que la variance intra-classe est faible. Il est préférable de choisir un nombre de classes minimisant la variance intra-classe. (c) Du gris clair au gris foncé, variance interclasse entre les quatre classes retenues. La variance interclasse est obtenue, pour les 76 jours médians, en calculant le ratio d’eTLES affectant chaque points de grille, pour chaque classe. Les points de grille représentés en foncé sur le graphique sont ceux étant les mieux discrétisés par les 4 classes.

1.4.2 Corrélation et régression linéaire

Dans cette étude, ces deux méthodes statistiques permettent d’analyser la relation linéaire entre deux paramètres X et Y.