• Aucun résultat trouvé

Le projet CMIP 5 (Coupled Model Intercomparison Project Phase 5 ) est un projet de coordination d’expériences de modélisation climatique avec des modèles de circulation générale couplés océan-atmosphère (Taylor et al.,2012). Ces modèles permettent de réaliser des simulations climatiques forcées par différents scénarios de composition de l’atmosphère en gaz à effets de serre et aérosols. Les principales expériences définies par CMIP5 sont :

— les simulations historiques (1850–2005) pour évaluer les modèles sur le passé ; — les projections futures (2006–2100 ou 2300) forcées par différents scénarios pour

la composition de l’atmosphère : RCP 2.6, 4.5, 6 et 8.5.

Les scénarios RCP (Representative Concentration Pathway) sont quatre scénarios hypothétiques quant à l’évolution de la concentration en gaz à effet de serre d’ici à 2100. Leur nom correspond au forçage radiatif obtenu en 2100 : de 2,6 à 8,5 W·m−2. Ici sont utilisés le scénario RCP 8.5 qui correspond à une croissance économique soutenue par les énergies fossiles et le scénario RCP 4.5 qui correspond à des émissions plus faibles.

Il y a aussi de nombreuses autres expériences destinées à évaluer les modèles et leurs réponses à différents changements atmosphériques, afin de mieux comprendre pour-quoi les modèles donnent des résultats différents.

Dans le cadre défini par CMIP 5, une trentaine d’équipes de modélisation du monde entier ont réalisé des simulations avec une soixantaine de modèles différents. Les ca-ractéristiques et résolutions des modèles diffèrent, mais leurs sorties doivent respecter un certain nombre de conventions afin de faciliter les études multi-modèles. Dans cette thèse on se limitera aux cinq modèles suivants :

— IPSL CM5A-MR : modèle de l’Institut Pierre-Simon Laplace (Dufresne et al., 2013)

— CNRM-CERFACS CM5 : modèle de Météo-France (Centre National de Re-cherches Météorologiques) et du Centre Européen de Recherche et de Formation Avancée en Calcul Scientifique (Voldoire et al.,2012)

— MOHC GEM2-CC : modèle du Met Office Hadley Centre (Royaume-Uni) — MPI ESM-LR : modèle du Max Plack Institut für Meteorologie (Allemagne) — NOAA GFDL ESM2G : modèle du NOAA Geophysical Fluid Dynamics

189

Annexe

B

Statistiques

Sommaire

B.1. Analyse en composantes principales (ACP) . . . 189

B.2. Partionnement . . . 191

B.1 Analyse en composantes principales (ACP)

L’analyse en composantes principales (ACP) est une méthode statistique très utilisée en sciences du climat pour décomposer un champ spatio-temporel dans un nouvel espace orthogonal qui maximise la variance.

Les vecteurs propres de la nouvelle base spatiale sont appelés EOF (Empirical

Ortho-gonal Functions) et les amplitudes, c’est-à-dire la série temporelles associée à chaque

EOF, sont appelées composantes principales ou PC (Principal Component).

Les EOF sont une construction mathématique, par conséquent il n’y a aucune garantie qu’ils aient une quelconque signification physique. Cependant on peut en général interpréter physiquement les EOF a posteriori car ils sont la signature de la dynamique du système climatique. Les premiers EOF expliquent le plus de variance du système et font donc ressortir les états préférentiels de l’atmosphère entre lesquels le système oscille.

Mise en œuvre

La variable tridimensionnelle que l’on veut décomposer est tout d’abord ramenée à une matrice bidimensionnelle de taille n × p, où n représente le nombre de pas de temps et p représente le nombre d’emplacements, de positions spatiales (p = plat×plon pour une carte grillée de plat latitudes par plon longitudes). Cette matrice est notée

X= (xij) :

— une ligne (xij)p

j=1 représente une carte pour l’instant ti. — une colonne (xij)n

i=1 représente la série temporelle à l’emplacement j.

Tout d’abord, la variable est centrée (chaque série temporelle est centrée, on retire la moyenne de chaque colonne) et éventuellement normée.

On résout le problème aux valeurs propres suivant :

RE= EΛ

où R est la matrice de covariance : R = XtX,

Λ est la matrice diagonale contenant les valeurs propres de R : (λj)p j=1 , E est la matrice des vecteurs propres, c’est la nouvelle base spatiale. Toutes ces matrices sont de taille p × p.

Dans la matrice E, chaque colonne ej est un vecteur propre (ou EOF) de R associé à la valeur propre λj. Chaque EOF explique une part de la variance de X à hauteur de λi/(Pp

j=1λj).

Chaque EOF est un vecteur de taille p qui correspond à une carte, donc à un motif spatial particulier, mais son amplitude varie dans le temps. L’évolution temporelle de ej est cj = Xej. cj est un vecteur de taille n (nombre de pas de temps), est appelée la composante principale (PC) associée à l’EOF j.

La matrice d’origine peut être reconstruite entièrement à partir des EOF et des PC :

X=

p X

j=1

cjej

En général, on ne reconstruit qu’un signal simplifié, avec non pas tous les EOF mais seulement un petit nombre q (q < p), parmi les premiers EOF, ceux qui expliquent le plus de variance. On retire ainsi le bruit pour ne s’intéresser qu’aux signaux les plus forts.

Norme

En climatologie on utilise en général une norme différente pour le produit scalaire, afin de tenir compte du fait que tous les emplacements n’ont pas le même poids. En

B.2. Partionnement 191 effet, une grille régulière en latitude et longitude ne conserve pas l’aire, qui varie en fonction de cos(θlat) où θlat est la latitude.

Utiliser une norme qui met un poids proportionnel à l’aire de chaque emplacement revient à multiplier les données d’entrée par p

cos(θlat) et à diviser par ce même facteur les EOF obtenus.

B.2 Partionnement

Le partitionnement (clustering en anglais) est une méthode statistique de classification visant à diviser un ensemble de données en différents groupes.

Il existe de nombreuses méthodes de partitionnement, une des plus courantes est l’algorithme des k-moyennes qui sépare les données en k groupes de façon à minimiser l’écart de chaque point par rapport à la moyenne de son groupe. Un example sur des données en deux dimensions (points du plan) est montré dans la figureB.1. Les points ont été séparés en trois groupes de sorte à minimiser les distances au barycentre de chaque groupe.

Figure B.1 – Exemple de mé-thode k-moyennes (k = 3) appli-quée à des données en deux di-mensions. Les croix indiquent les centres de chaque groupe (une couleur par groupe).

−4 −3 −2 −1 0 1 2 3 4 −3 −2 −1 0 1 2 3

Documents relatifs