• Aucun résultat trouvé

Analyse de la variabilit´e intrins`eque oc´eanique `a partir de si-

6.2 Perspectives de recherche

6.2.3 Analyse de la variabilit´e intrins`eque oc´eanique `a partir de si-

de simulations d’ensemble

Une des limites de l’utilisation de simulations saisonni`eres (exp´eriences-I ) est de ne s’in- t´eresser qu’`a l’expression spontan´ee du chaos dans le cadre d’un syst`eme quasi-autonome, c.-`a-d. sans d´ependance aux variations du for¸cage atmosph´erique (hormis celles du cycle saisonnier). Or, l’oc´ean r´eel est un syst`eme non-autonome car il d´epend fortement du for- ¸cage atmosph´erique - du moins lin´eairement. L’influence du for¸cage sur le comportement chaotique de l’oc´ean turbulent est n´eanmoins peu connue et est un sujet de recherche actif. Le projet OCCIPUT de simulation ensembliste ORCA025 a pour objectif d’´etudier

la sensibilit´e aux conditions initiales de l’oc´ean global turbulent simul´e (au 1/4) sous

for¸cage atmosph´erique complet, similaire `a l’exp´erience c´el`ebre de Lorenz (1963) mettant en ´evidence le comportement chaotique d’un syst`eme non-lin´eaire. La variabilit´e intrin- s`eque est d´efinie dans ce contexte comme ´etant la dispersion par rapport `a la moyenne d’ensemble des diff´erentes r´ealisations. En toute rigueur, cette variabilit´e intrins`eque est diff´erente de celle isol´ee dans les simulations saisonni`eres car le syst`eme est math´emati- quement diff´erent (en raison du for¸cage). Cependant, dans la mesure o`u la dispersion par rapport `a la moyenne d’ensemble des simulations OCCIPUT serait proche de l’´ecart-type temporel d’une simulation saisonni`ere du type exp´erience-I, nous pourrions en tirer deux conclusions : 1) les statistiques ensemblistes, du moins la dispersion d’ensemble, sont cor- rectement approxim´ees par la simulation saisonni`ere (syst`eme ergodique), 2) le for¸cage influence peu les caract´eristiques intrins`eques (niveaux de variabilit´e, modes) du syst`eme isol´ees dans une simulation saisonni`ere. Le projet OCCIPUT est actuellement en cours et les premiers r´esultats sur la SLA et sur l’AMOC semblent montrer que la variabilit´e intrins`eque estim´ee dans la simulation saisonni`ere est proche de la variabilit´e intrins`eque bas´ee sur la dispersion d’ensemble.

Les simulations d’ensemble OCCIPUT permettront en outre d’´etudier la variabilit´e oc´eanique forc´ee (estim´ee `a partir de la moyenne d’ensemble), sur laquelle nous avons volontairement fait l’impasse dans cette th`ese. En effet, en faisant les hypoth`eses que les composantes de variabilit´e intrins`eque I(t) et forc´ee F (t) s’additionnent et sont d´ecor- r´el´ees, on peut obtenir une estim´ee de la variance forc´ee σF2 par la simple soustraction σ2

F = σT2 − σ2I, σ2T et σI2 ´etant respectivement les variances intrins`eque et totale. Or, Pen-

duff et al. (2011) ont montr´e que ces hypoth`eses peuvent ˆetre rejet´ees dans les r´egions turbulentes de bord-ouest et dans l’ACC, car le ratio des variances intrins`eque sur totale σ2

I/σ2T exc`ede en certains endroits 100%. L’acc`es au signal forc´e avec OCCIPUT sera en

outre int´eressant pour compl´eter l’analyse du chapitre 4 sur les incertitudes induites par la variabilit´e oc´eanique intrins`eque sur l’estimation des tendances r´egionales du niveau de la mer. On pourra alors regarder le ratio signal sur bruit des tendances moyennes r´egionales forc´ees, estim´ees sur la p´eriode altim´etrique, par rapport `a la dispersion des tendances induite par la variabilit´e oc´eanique intrins`eque. Cela permettra de quantifier la mesure dans laquelle les tendances observ´ees en altim´etrie sont reli´ees au for¸cage atmosph´erique (incluant le signal anthropog´enique).

Une des limites de ces simulations d’ensemble sera sans doute la repr´esentation des modes de variabilit´e des courants de bord-ouest. En effet, il est probable que les simula- tions au 1/4peinent `a repr´esenter les variabilit´es des courants du Kuroshio et du Gulf

Stream par rapport aux observations `a cause d’une r´esolution trop faible. Le mˆeme type d’exp´erience au 1/12serait sans doute pr´ef´erable mais est difficilement r´ealisable avec les

moyens de calcul actuels. Il serait toutefois int´eressant d’analyser si les courants de bord- ouest exhibent des modulations d’intensit´e et de position dans ces simulations d’ensemble - mˆeme si ces variations ne sont pas repr´esentatives de celles observ´ees dans l’oc´ean.

Les probl`emes informatiques de m´emoire et de temps de calcul, rencontr´es lors du post- traitement des donn´ees de NEMO 1/12, risquent d’apparaˆıtre ´egalement lorsque l’on

souhaitera traiter l’ensemble de 50 simulations au 1/4g´en´er´e dans OCCIPUT. Aussi,

il serait int´eressant de g´en´eraliser les outils pyClim, d´evelopp´es dans cette th`ese, afin d’inclure la dimension ensembliste. Cela pourrait ˆetre fait `a travers la r´ealisation concr`ete d’un concept d’outil plus g´en´eral, tel que celui pr´esent´e dans l’annexe A.

Annexe A

Pr´esentation du concept DOABLE : Diag-

nosing Ocean/Atmosphere Big data with

Little Effort

Sommaire

A.1 Introduction . . . 136 A.2 D´efinition du cahier des charges du concept . . . 136 A.2.1 Repr´esentation et acc`es `a une base de donn´ees . . . 137 A.2.2 Classification des diff´erents types de diagnostiques . . . . 138 A.2.3 D´ecoupage du domaine et parall´elisation des calculs . . . 140 A.2.4 Un outil collaboratif . . . 142 A.3 D´efinition des objets et d’un script type . . . 142 A.3.1 Gestion des Entr´ees/Sorties . . . 143 A.3.2 Parall´elisation et gestion de la m´emoire . . . 144 A.3.3 Structuration d’un script . . . 145 A.4 Conclusion . . . 146

A.1

Introduction

Devant l’augmentation croissante de la taille des donn´ees issues de mod`eles d’oc´ean (p. ex. mod`ele NEMO, Madec, 2008), d’atmosph`ere, et des futures observations satellitaires (p. ex. projet SWOT, Fu and Ubelmann, 2013), un probl`eme se pose sur la fa¸con de traiter efficacement ces donn´ees en vue d’analyses scientifiques. `A titre d’exemple, un champ de surface du niveau de la mer du mod`ele d’oc´ean global NEMO, `a la r´esolution 1/12, sur 40

ans et en moyenne mensuelle, repr´esente l’´equivalent de 50 Go de donn´ees. Ce d´efi technique peut en effet se r´ev´eler un obstacle important `a la production scientifique. Il semble qu’une solution g´en´erique doit ˆetre pens´ee. Or, les ordinateurs actuels de bureau ne permettent pas de charger un tel volume de donn´ees en m´emoire vive, et seuls quelques nœuds sp´ecifiques sur les super-calculateurs (HPCs) allouent un quota de m´emoire suffisant pour ce type d’analyse. Il y a potentiellement deux fa¸cons de pallier ce probl`eme. La premi`ere consiste `

a ´elaborer la plupart des diagnostiques en amont de la simulation, lors du design de celle-ci. Les analyses sont alors r´ealis´ees “on-line”, c’est-`a-dire qu’elles sont effectu´ees et stock´ees au fur et `a mesure de l’avanc´ee de la simulation. Si cependant un diagnostique n’a pas ´et´e ´etabli en amont, il sera plus difficile de le r´ealiser par la suite et il faudra probablement faire appel `a une solution alternative. Cette alternative consiste `a faire l’analyse a posteriori de la simulation, et ce de fa¸con similaire `a un calcul intensif en utilisant un d´ecoupage du domaine et une parall´elisation des calculs. Le d´ecoupage du domaine permet `a la fois d’optimiser la gestion de la m´emoire, mais ´egalement la parall´elisation du calcul sur chacun des sous-domaines.

Le concept DOABLE, Diagnosing Ocean Ocean/Atmosphere Big data with Little Effort se propose donc de dresser le cahier des charges et les bases d’un outil permettant l’´elabo- ration et la mise en œuvre de diagnostiques sur des bases de donn´ees hautes-r´esolutions, en s’affranchissant des contraintes de m´emoire par une gestion intelligente de celle-ci, et en rendant les diagnostiques abordables en temps de calcul grˆace `a la parall´elisation.