Régularisation de problèmes inverses à l'aide de l'équation de diffusion, avec application à l'assimilation variationnelle de données océaniques

(1)

HAL Id: tel-00525590

https://tel.archives-ouvertes.fr/tel-00525590

Submitted on 12 Oct 2010

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

publics ou privés.

l’équation de diffusion, avec application à l’assimilation

variationnelle de données océaniques

Isabelle Mirouze

To cite this version:

Isabelle Mirouze. Régularisation de problèmes inverses à l’aide de l’équation de diffusion, avec

appli-cation à l’assimilation variationnelle de données océaniques. Mathématiques [math]. Université Paul

Sabatier - Toulouse III, 2010. Français. �tel-00525590�

(2)

(3)

(4)

Remer iements

Il est somme toute un peu urieux que lapremière page d'unmémoire soit en général la dernière à êtrerédigée. Maisje mepliei i volontiers àlatradition desremer iements. Abandonner eque l'on a mis des années à onstruire professionnellement pour s'engager dans une voie résolument diérente n'est pasun hoixanodin.C'est pourtant elui quej'aifaitpar equ'aimer equel'on faitdanslavie, 'est essentiel. Après inq années di iles (deux ans de master plus 3 années de do torat), je reste persuadée plusque jamaisquej'ai faitle bon hoix,même si est à l'avenir de le onrmer. Pourtant es années furent bien plus ardues que je ne l'avais pensé au départ, tant il m'apparaît aujourd'hui quej'ainégligé ertainsaspe tsessentielsquifontdenous equel'onest.Mais esannéesfurentaussi l'o asionex eptionnellededé ouvrirunmondediérent de elui queje onnaissais,etd'y toyerdes personnesformidablesvenantdesquatre oinsduglobe

1

.Atous euxquim'ontsoutenue,jevoussuis re onnaissante etvousdemandedemepardonner sijene vous itepasexpressémentdans e quisuit.

Par equ'ilnepeutyavoirdethèsesans euxquia eptentdelajuger,jesouhaiteraistoutd'abord remer ierlesmembresdemonjury.A ommen erparmesdeuxrapporteurs,Yanni kTrémolet etEri Blayo,qui, malgré leurs nombreuses obligations, ont a epté la harge supplémentaire d'évaluer mon travail.A Pierre Maré halquia bienvouluprésider e jury,etàArthur Vidard etKristian Mogensen qui ont fait o e d'examinateurs, mer i. Mais il ne peut non plus yavoir de thèse sans eux qui a - eptent del'en adrer.Alorsàmondire teurSergeGrattonet mesdeux o-dire teurs AnthonyWeaver etLu aAmodei,mer iaussi,pourl'aideetlesoutienquevousm'avezapporterdurant estroisannées. Je vousremer ie également pourlesoinquevousavez prisàrelire monmémoire etpourlapertinen e de vos ommentaires qui m'ont permis de tant l'améliorer. Mer i aussi à Claire Chauvin et Andrea Pia entini dontlarele ture attentivede emanus ritfutd'uneaidepré ieusepour mettreuntantsoit peude ohéren e dansl'assemblage de motsqu'il représentait.

Un grand mer i également à Sophie Ri i et Ni olas Daget pour l'aide inestimable qu'ils m'ont apportésàmesdébuts,ainsiqu'àElisabethRémypourtoutesnosdis ussions.ALu GiraudetXavier Vasseurpour tousleurs onseils avisés.AArnaudFossoPouanguépour nospauses tiKféet pour son amitié, en parti ulier dans les moments de ras-le-bol. A Thomas Pangaud qui a partagé un bureau ave moi durant ma dernière annéeeta supporté ave un stoï isme remarquable, mes monologues et omportements un tantinet insolites parfois. A Olivier Titaud, arrivé sur le tard de ma thèse, et qui s'estbienrattrapésurlaquantitéde questionsqu'il apumeposer,maism'aidant sefaisantà larier mes idées pour masoutenan e. A mondo teur personnel Chantal Nasri, qui m'a pres rit une minute minimum de rigolade par jour, et s'est souvent assurée personnellement du bon suivi de sa pres rip-tion.Ennàmafamille(étendue)quinem'ajamaisquestionnéesurmesdé isionsparfoisa robatiques.

Pour en terminer, il est trois personnes que je tiens à remer ier parti ulièrement pour l'inuen e qu'ilsont eusur monpar ours.Par ordre hronologique, je ommen eraipar FabienDurand, qui m'a initiée à l'o éanographie. Tuteur de mon stage de master 1, il a toujours pris la peine de répondre à mes questions, même basiques, ave beau oup de patien e et a guidé ave beau oup de diligen e mes premiers pas dans le monde de la re her he. Gérald Desroziers ensuite, que j'ai eu le privilège d'avoir omme professeur en assimilation de données. Par laqualité de ses ours, il està l'origine de

(5)

monengouement pour ettedis ipline, etasupiqué ma uriositépour ette matri e

B

simystérieuse. And last but not least, magratitudeest toutea quise àAnthonyWeaver quim'a supporté(danstous les sens du terme) pendant es trois ans. Pour son enthousiasme ommuni atif, nos dis ussions sans n,sonaide et ses onseils pré ieux. Mais surtout pour son soutienindéfe tible, y ompris dansmes moments di iles et mes rises de (mauvaise) foi. Dans e que e travail de thèse a de meilleur, une grandepartlui enest attribuable.

Mer i enn à tous eux que je n'ai pas nommé,mais qui ont fait parti de mon quotidien tout au longde esannées, audétourd'un ouloir, d'unetablede antine oud'une onféren e,i i ouailleurs.

(6)

Résumé

Régularisation de problèmes inverses à l'aide de l'équation de

diusion, ave appli ation à l'assimilation variationnelle de données

o éaniques

En assimilation de données, les modèles de orrélation permettent de ara tériser les stru tures d'erreurs pourles variables dénies surune grille numérique. L'équation de diusionfournit un adre exible ete a e pour représenter desfon tionsde orrélation pour des problèmes degrande dimen-siontels que euxren ontrés enassimilation variationnelle pour l'atmosphère ou l'o éan.

Dans ette thèse, une formulation impli ite est d'abord étudiée en détail en dimension un (1D). On montre qu'intégrer une équation de diusion impli ite à oe ient onstant sur M pas de temps estéquivalent à onvoluerla onditioninitialeàunefon tionautorégressive (AR)d'ordreM. L'é helle de orrélation de la fon tion AR et le fa teur de normalisation requis pour générer une amplitude égale à 1 sont donnés en fon tion du oe ient de diusion et de M. Des extensions du modèle de diusion permettant aux fon tions de orrélationde ne pasêtre ae tées par les frontières, et tenant ompte de variations des é helles sont dé rites.Une approximation des fa teurs de normalisation est alors proposée.

Desproduitsd'opérateursdediusionimpli ite1Dsontensuiteutiliséspour onstruiredesmodèles de orrélation endimension deuxettroispourdes ongurations globalesd'unsystèmed'assimilation variationnelle pour le modèle o éanique NEMO. Leurs performan es sont omparées au modèle de diusion expli ite existant, et des exemples de stru tures de orrélation où les é helles sont soit pa-ramétrées, soit issues d'uneméthode d'ensemble, sont montrés.Enn, les performan es dediérentes te hniques denormalisation sont omparées.

Mots lés :

(7)

(8)

Abstra t

Regularization of inverse problems using a diusion equation, with

appli ation to variational o ean data assimilation

Correlationmodelsarerequiredindataassimilationto hara terizetheerrorstru turesofvariables denedonanumeri algrid.Thediusionequationprovidesaexibleande ientframeworkfor repre-senting orrelationfun tions forproblems of large dimension su has thoseen ountered invariational atmospheri or o eandataassimilation.

In this thesis, an impli it formulation of the diusion equation is rst analyzed in detail for the one-dimensional(1D) ase.Itisshownthatintegratinga onstant- oe ientimpli itdiusionequation over

M

time steps isequivalent to onvolvingtheinitial onditionwithan

M

-th orderautoregressive (AR)fun tion. The orrelation length s ale oftheAR fun tion and thenormalization fa tor required forgeneratingaunitamplitudearegivenintermsofthediusion oe ient and

M

.Extensionsofthe diusion model to allow for orrelation fun tions that arenot ae ted by solid boundaries, and that a ount forvaryinglengths alesaredes ribed.An approximationofthenormalizationfa torsisthen proposed.

Produ tsof1Dimpli itdiusionoperatorsarethenusedfor onstru tingtwo-andthree-dimensional orrelation models for global ongurations of a variational assimilation systemfor theNEMO o ean model. Their e ien y are ompared to the existing expli it diusion model, and examples of or-relation stru tures are shown, where the length s ales are eitherparametrized or estimated using an ensemblemethod.Finally, thee ien y ofdierent normalization te hniquesare ompared.

Keywords:

(9)

(10)

Table des matières

Introdu tion 15

1 Un problème inverse : l'assimilation de données 19

1.1 Lesproblèmes inverses . . . 19

1.2 L'assimilationde donnéesen o éanographie . . . 21

1.2.1 Le modèle . . . 21

1.2.2 Lesobservations . . . 22

1.2.3 Comparaison modèle/ observations . . . 25

1.2.4 Le problèmeinverse . . . 26

1.3 Lesdiérentes te hniques pour l'o éanographieet lamétéorologie . . . 27

1.3.1 Un brefhistorique . . . 27 1.3.2 L'assimilationaujourd'hui . . . 29 2 L'assimilation variationnelle 31 2.1 Formalisme duproblème . . . 31 2.1.1 Problème ontinu . . . 31 2.1.2 Problèmedis ret . . . 32 2.1.3 Dénition delanorme . . . 33

2.2 Lesdiérentes formulations . . . 36

2.2.1 La formulationdu 4D-Var . . . 36

2.2.2 La formulationin rémentale . . . 38

2.2.3 Le 3D-Var,une simpli ationdu 4D-Var . . . 42

2.2.4 La formulationduale :4D-PSASet3D-PSAS . . . 43

2.3 Lesmatri esde ovarian esd'erreur . . . 44

2.3.1 Nature deserreurs . . . 44

2.3.2 Leserreursd'observations . . . 46

2.3.3 Leserreursd'ébau he . . . 46

2.4 Résolution duproblème variationnel . . . 47

2.4.1 Lesdiérents espa es. . . 47

2.4.2 Minimisation de lafon tion oût . . . 49

2.4.3 Le al uldugradient en pratique . . . 51

3 Modélisation de la matri e des ovarian es d'erreur d'ébau he 57 3.1 Le problèmefondamental . . . 57

3.1.1 Modélisationde

B

−1

. . . 57

3.1.2 Changement de variables. . . 60

3.2 Estimationdesstatistiques de

B

. . . 62

3.2.1 Méthodesbasées surles observations . . . 63

3.2.2 La méthode NMC . . . 65

3.2.3 La méthode d'ensemble . . . 65

(11)

3.3.2 Modélisationdes ovarian esunivariées . . . 70

3.4 Les diérenteshypothèsesdiagonales . . . 70

3.5 Spé i ation desvarian es . . . 74

3.6 Spé i ation desfon tionsde orrélation . . . 75

3.6.1 Evaluationdesintégrales de onvolution . . . 76

3.6.2 Le ltre ré ursif. . . 77

3.6.3 L'équation de diusion . . . 79

3.6.4 La normalisation . . . 80

4 Opérateur de diusion impli ite 1D 83 4.1 Introdu tion . . . 87

4.2 Ba kgroundtheory . . . 89

4.2.1 Covarian e fun tionsand ovarian e operators. . . 89

4.2.2 Correlation fun tionsand orrelationoperators . . . 91

4.3 Correlation operatorsand thediusionequation. . . 92

4.3.1 Expli it andimpli it formulations of the 1Ddiusionequation . . . 92

4.3.2 The kernel oftheimpli it diusion operator . . . 95

4.3.3 Chara teristi s oftheAR fun tions . . . 97

4.3.4 Combinations of ARfun tions . . . 100

4.4 Inhomogeneous andanisotropi extensions . . . 103

4.4.1 Lo ation-dependent lengths ales . . . 103

4.4.2 Boundary onditions . . . 107

4.5 Numeri al aspe ts . . . 111

4.5.1 Curvilinear oordinates . . . 111

4.5.2 Dis retization and solutionalgorithm . . . 111

4.5.3 Link withthe re ursive lter . . . 114

4.6 Summary and dis ussion . . . 115

4.A Matérn andAR fun tions . . . 117

4.BRe overing the Gaussian solutionnearboundaries . . . 118

5 Constru tions 2D et 3D à partir de l'opérateur de diusion impli ite 1D 121 5.1 Le systèmeNEMOVAR . . . 121

5.2 Constru tion d'opérateurs de orrélation 2et3

×

1D. . . 123

5.2.1 Fon tionsde orrélationséparables . . . 123

5.2.2 Sensibilité au nombred'itérations . . . 126

5.2.3 Non séparabilité près desfrontières . . . 127

5.2.4 Non séparabilité due auxvariations desé hellesde orrélation . . . 131

5.3 Appli ation au systèmeNEMOVAR . . . 133

5.3.1 Aspe tsnumériques . . . 133

5.3.2 Tests delabou leinterne . . . 138

5.3.3 Expérien ed'assimilation . . . 143

5.3.4 Variation géographique desé helles . . . 145

5.4 Pré ision de lanormalisation . . . 147

5.4.1 Les diérentesméthodesde normalisation . . . 147

5.4.2 Simulationde frontièrestransparentes . . . 149

5.4.3 Méthoded'évaluation . . . 150

5.4.4 Méthodespar ve teursaléatoires . . . 151

5.4.5 Méthodespar approximationdu fa teurthéorique . . . 152

(12)

A Analyse fon tionnelle 173

A.1 Rappel surlesespa es . . . 173

A.2 Formeslinéaires etespa edual . . . 174

A.3 Opérateurs linéairesetadjoints . . . 175

B Probabilités et statistiques 177 B.1 Variablesaléatoires . . . 177 B.1.1 Dénitions . . . 177 B.1.2 Moments . . . 178 B.1.3 Loide Gauss . . . 179 B.1.4 Probabilités onditionnelles . . . 180

B.2 Champsaléatoires etopérateurs statistiques . . . 181

C Estimateur de la moyenne onditionnelle 183 D Minimisation par la méthode du gradient onjugué 187 D.1 Méthode delaplus fortedes ente . . . 188

D.2 Méthode dugradient onjugué . . . 189

D.3 Gradient onjuguépré onditionné . . . 192

E Méthode de normalisation proposée par Purser et al. (2003b) 193 F Réorganisation des pro esseurs 197 F.1 Réorganisationzonale . . . 198

(13)

(14)

Table des gures

1.1 Modélisation d'unsystèmephysique . . . 20

1.2 Réseaud'observations o éaniques in situdu programme TOGAen dé embre1994. . . 23

1.3 Déploiement de proleursArgoau 3 janvier2010. . . 24

1.4 Réseaud'observations satellitepour lamétéorologie etl'o éanographie de laNASA. . 25

2.1 Système S. . . 31

2.2 Le système4D-Varin rémental . . . 40

2.3 Lesitérationsdu 4D-Var multi-in rémental . . . 40

2.4 Le système3D-Var . . . 42

2.5 Stru turedeserreurs àpartirde variablesaléatoires . . . 45

2.6 Lesdiérents espa esetleurs relations.. . . 48

3.1 Lesdiérentes te hniques d'estimation/modélisation de

B

. . . 58

3.2 Estimationde

B

àpartir desobservations . . . 64

3.3 Estimationde

B

àpartir d'unensemble . . . 66

3.4 Modélisation de

B

près desfrontières . . . 75

4.1 Shape of theARfun tions . . . 99

4.2 Powerspe trumof the AR fun tions . . . 99

4.3 Normalization oe ient . . . 100

4.4 Correlation fun tionbuilt from the dieren e oftwo SOAR fun tions . . . 103

4.5 Powerspe trumof the orrelationfun tion built fromthetwo SOAR fun tions . . . . 103

4.6 Resultofa 2-step impli it diusionoperator withvariable oe ients. . . 106

4.7 Comparisonof dierent normalization fa torsfor variablediusion oe ients . . . 107

4.8 Exa t normalization nearboundaries for

M = 2

andNeumann or Diri hlet BCs . . . . 108

M = 2

andRobinBCs . . . 109

M = 10

andNeumann or Diri hlet BCs . . . 109

4.11 Estimationof the normalization fa tornear boundaries . . . 110

5.1 GrilleC selon Arakawa . . . 122

5.2 Sensibilité aunombre d'itérations . . . 126

5.3 Erreur demodélisation d'unegaussienne par l'appli ation del'opérateur 2

×

1D . . . . 127

5.4 Opérateur 2

×

1Dprèsdesfrontières, formulation 1 . . . 128

5.5 Opérateur 2

×

1Dprèsdesfrontières, formulations 2,3et4 . . . 130

5.6 Exemple devariation desé helles . . . 132

5.7 Exemple de orrélations obtenuespour l'opérateur 3

×

1D . . . 135

5.8 Zoomprès desfrontières delagure 5.7et omparaison ave l'expli ite . . . 137

5.9 Comparaisondes performan es de l'assimilation . . . 144

5.10 E helles de orrélationzonalesissues d'uneméthode d'ensemble(Daget, 2008) . . . 146

5.11 Corrélationsobtenues pour l'opérateur 3

×

1Dave é helles géographiques. . . 146

(15)

5.14 Evaluationde la onguration N°4,ORCA1,é hellesparamétrées . . . 154

5.15 Evaluationde la onguration N°4,ORCA2,é hellesestimées . . . 155

5.16 E helles de orrélation verti alesissues d'uneméthoded'ensemble(Daget, 2008). . . . 155

5.17 Eet de lavariation desé helles . . . 157

B.1 Coe ientsd'asymétrie etd'aplatissement . . . 179

B.2 Corrélations inhomogènes etanisotropes . . . 181

B.3 Symétriede lafon tion de orrélation . . . 182

D.1 Minimisation pour une matri edénie positive . . . 187

D.2 A-orthogonalité . . . 189

F.1 Dé omposition par domaineshorizontaux . . . 198

F.2 Réorganisation zonale despro esseurs . . . 199

(16)

Liste des tableaux

4.1 Expressionasso iated withthe

M

-thorder ARfun tions . . . 99

4.2 Expressionasso iated withthe Gaussian fun tion . . . 99

5.1 Temps d'exé ution(ORCA2,DELLPre isionT5500,

1 × 1

) . . . 139

5.2 Temps d'exé ution(ORCA2,DELLPre isionT5500,

4 × 2

) . . . 141

5.3 Temps CPUetmémoire (ORCA1,CGMOD,IBM POWER6) . . . 142

5.4 Temps CPUetmémoire (ORCA1,CONGRAD/CGMOD-,IBM POWER6) . . . 142

5.5 Détaildes inq ongurations de normalisation évaluées. . . 151

(17)

(18)

Introdu tion

Lamodélisationdeso éanspermetd'établirdesprévisionso éaniquesquitrouventuneappli ation dansdesdomainesaussivariésquelare her he(supportaux ampagnesen mer,...),l'industrie (res-sour es halieutiques, transport maritime, ...), l'environnement (estimation des risques de pollution, ...)oumêmelesloisirsdeplaisan eetles oursesaularge.Leso éanssontégalementune omposante essentielledenotre limat,desortequeprévisionsmétéorologiqueseto éaniquessontindisso iables,et un eort important a étéfait esdernières dé enniespour oupler leurs modélisations respe tives. De plus,touteétude limatologique,qu'ils'agissedepaléo limatologieoud'estimationdu limatfutur,est ainsiassujettieàla onnaissan e de l'étato éanique. Maisles pro essusphysiquesmis en ÷uvredans leso éansrendentleurmodélisationmathématique déli ate,et lagrandetailleduproblèmeimposede trouverdesalgorithmes adaptés etde les déroulersurdes al ulateursparallèle àhaute performan e, omplexiant de e fait l'aspe tnumérique du problème. De plus, des in ertitudes, tant dans les mo-dèles que dans les mesures physiques, peuvent produire des é arts importants entre les états prévus par lesystèmeetles états observés.

L'assimilationdedonnées onsistealorsà ombinerl'étatproduitparlemodèle(ébau he)ave des observationsphysiques,ande orrigerles onditionsinitialeset/ouforçageset/ouparamètres quiont onduità etteébau he,etdeproduireainsiunnouvelétat(analyse)pluspro hedelaréalité.En o éa-nographie, e problème inverse se présentesouvent sous la forme d'un problème de minimisation qui doitêtrerégularisé.Comptetenudes ontraintesdenonlinéarité,onutilisesouventunsystèmeitératif où haqueitération onsiste à minimiser une fon tion quadratique. Celle- i est obtenue en linéarisant les opérateurs de la fon tionnelle non linéaire au voisinage du résultat obtenu par l'itéré pré édent. La séquen e est initialisée en linéarisant au voisinage de l'ébau he. Cette fon tionnelle quadratique dé rit, au sens des moindres arrés, l'é art à l'ébau he pondéré par la onan e que l'on a orde à ette ébau he d'une part, et l'é art aux observations pondéré par la onan e que l'on a orde à es observations d'autre part. Cette onan e, ou pré ision, s'exprime par l'inverse de la matri e des o-varian esde l'in ertitude (erreurs) asso iéeà l'ébau he etauxobservations respe tivement.

Les observations sont généralement supposées non- orrélées (bien que lorsqu'elles proviennent de satellites par exemple, ette hypothèse soit fortement dis utable), et leur pré ision est alors obtenue en inversant simplement les varian es de l'erreur liée à leur mesure. La matri e représentant les o-varian es d'erreur d'observations est alors diagonale. Mais on ernant l'ébau he, au un argument ne peutétayer l'hypothèse de la dé orrélation des erreursen haque point de grille du modèle. Deplus, les équations physiques résolues par lesystème montrent, de par leur nature, qu'il existe une relation entre les diérentes variables de e modèle. Pour résoudre le problème de minimisation, il faut don estimer et inverser une matri e de grande taille. Dans le as d'une grille basse résolution pour une ongurationglobalepar exemple,eten onsidérantles hampsentroisdimensionsdelatempérature, de lasalinité etdes omposantes zonale (est/ouest) etméridienne (nord/sud) des ourants, ainsique le hamp en deux dimensions de la hauteur d'eau, le ve teur d'état atteint fa ilement une taille de l'ordrede

10

6

éléments.Pluslarésolutiondumodèleesthaute,etpluslataillede eve teuraugmente.

(19)

er-del'inverser.Ilestdon indispensable dedévelopperdesalgorithmese a espermettantd'estimerou demodéliserlamatri e des ovarian esd'erreurd'ébau heàpartir d'hypothèsesraisonnables.Dans e dernier as, l'opérateur est donné en évaluation, i.e.lamatri e n'est jamaisa essible, mais l'évalua-tion orrespond au produit de ette matri e par le ve teur auquel est appliqué l'opérateur. Dans un premier temps, on utilise souvent la formulation proposée par Derber et Bouttier (1999) permettant de dé omposer haque variable en une omposante dite équilibrée, i.e. liée aux autres variables par desrelationsphysiquesd'équilibre(géostrophieparexemple),etune omposantepropreindépendante, don dé orrélée des autres variables. En s'aran hissant des relations qui existent entre les ompo-santeséquilibréesdesdiérentesvariables,ilestalors possible depasserd'uneformulation multivariée (existen ede ovarian esd'erreurentrelesvariables)àplusieursformulationsunivariéesindépendantes ( ovarian esd'erreurspatialespour haquevariable).Ces ovarian es univariéespeuvent alors s'expri-mer par l'asso iation de leurs varian es et de leurs orrélations. Dans ette thèse, on se propose de poursuivrelestravauxdeWeaveretCourtier(2001)etWeaveretRi i(2004)quiutilisentlarésolution del'équation dediusion pourmodéliser es orrélationsunivariées.

Les orrélations univariées peuvent en eet être représentées par un opérateur de orrélation, e qui,pardénition,revientàévalueruneintégrale.Lorsquelafon tionde orrélation,noyaude l'opéra-teur,nedépendqued'unedistan eeu lidienne, etteintégrale orrespondàunproduitde onvolution. L'équation de diusion est alors une alternative e a e à l'évaluation de tels produits pour un pro-blème de grandetaille. En eet,on montrefa ilement que la solutiond'une équation de diusion 1D lassiqueest, aufa teur

1/(

√

2π L

g

)

prêt,leproduitde onvolution dela onditioninitialeparla fon -tiongaussienne

e

−x

2 _/2L

2 g

,où

L

g

=

√

2κT

est l'é helle de orrélation, ave

κ

le oe ient de diusion, et

T

lepseudo-temps d'intégration. Appliquer l'équation de diusionsur unpseudo-temps

[0, T ]

àun hamps alaire, 'estdon appliquerà e hamps alaireunopérateurde ovarian edenoyaugaussien. Une fois normalisé par le fa teur

√

2π L

g

, et opérateur de ovarian e devient alors un opérateur de orrélation.

Weaver et Courtier (2001) exploitent ette propriété et proposent une résolution par s héma ex-pli ite d'une équation de diusion 2D sur la sphère pour l'horizontale ombinée à une équation de diusion1Dpourlaverti ale.Maissi le odage expli iteest aisé, e s hémaprésentelegros désavan-tagede n'êtrestablequesousune onditiondépendant durapportau arré,del'é helle de orrélation sur le pas spatial. Ainsi, plus on monte en résolution ou plus l'é helle est grande, et plus le nombre d'itérationsaugmente,rendantalorsle oûtdel'algorithmeprohibitif.WeaveretRi i(2004)suggèrent alorsd'utiliser uns hémaimpli ite, in onditionnellement stable.Maisle odage de e s hémaestplus di ile àmettre enpla e puisqu'ilné essite l'inversiond'unematri e de grandetaille.

Dans ette thèse, on étudie plus avant le s héma impli ite, en se fo alisant tout d'abord sur la théoriedel'équationdediusion1D,etsonextensionàd'autresdimensions.Ilestintéressantdenoter que ettethéorien'est enau unefaçon liéeauproblèmedel'erreur d'ébau he etpeutégalement servir dansd'autres ontextestelsquelamodélisationdes orrélationsdel'erreurdumodèle(spatialeou tem-porelle)oumême del'erreurdesobservationslorsque elles- i seprésententsouslaformed'unproduit dénisur une grille. Néanmoins, pour ette thèse, l'appli ation de esdéveloppements théoriques se-rontréaliséspourl'erreurd'ébau hedansle adredusystèmed'assimilationvariationnelleNEMOVAR.

Mais un autre aspe t important du problème, on erne la normalisation de l'opérateur de ova-rian e représenté par l'équation de diusion. En eet, lorsque les é helles de orrélations varient en fon tionde leurs positions géographiques, oulorsque l'on estpro hedes frontières, lanormalisation à appliquer ne orrespond plus à un simple fa teur tel que

√

2π L

g

donné plus tt. On utilise alors des algorithmes pour al uler es fa teurs, mais eux- i peuvent s'avérer fort oûteux. Dans ette thèse, ons'intéresse don également à eproblème en her hant à évaluerdiérentes ongurations.

(20)

troduire le ontexte du sujet de ette thèse (quelques rappels mathématiques sont donnés dans les Annexes A, B et D). On expose tout d'abord la philosophie d'un problème inverse et on identie lesdiérentes omposantes asso iéesau asparti ulier del'assimilation dedonnéeso éanographiques. Puis on détaille au hapitre

2

la te hnique de l'assimilation de données variationnelle (le prin ipe du ltredeKalmanestdonnéenAnnexeC).Enn, ons'intéresseau hapitre 3auxdiérenteste hniques permettant d'estimer ou de modéliser les ovarian es d'erreur d'ébau he. Dans le as de la modélisa-tion par des opérateurs, un paragraphe est également onsa ré à la normalisation qui doit leur être asso iée,etle détailde laméthode proposée par Purser et al. (2003b) estdonné en Annexe E. Après ette partie introdu tive, les deux hapitres suivant sont onsa rés aux travaux réalisés au ours de ettethèse.Le hapitre4exposetoutd'abordlathéoried'unopérateurdediusion1Detsarésolution par un s héma impli ite.Les aspe tsnumériques tels queles onditions auxfrontières ou lavariation spatiale desé helles de orrélations sont abordés. Ces opérateurs 1Dsont ensuiteutilisés ( hapitre 5) pour onstruire des opérateurs 2D et 3D qui sont alors appliqués à la modélisation des orrélations univariées de l'erreur d'ébau he dans le système d'assimilation de données o éaniques variationnelle NEMOVAR.Desdétails te hniques on ernant ette onstru tion sont donnésen Annexe F.Dans un dernier paragraphe, on évalue également diérentes te hniques de normalisation. Enn, le hapitre 6 est onsa ré aux on lusionsquel'on peuttirer de e travail etauxperspe tivesqu'il ouvre.

Les te hniques d'assimilation de données appliquées à l'o éanographie sont très pro hes de elles développées en météorologie. Au ours de e manus rit, on trouvera don des référen es liées à es deuxdomaines sansqu'il soit né essairement faitdedistin tion. Enplus desarti lesetouvrages ités expressément au ours desparagraphessuivants, lesétudes réalisées, ainsiquel'é riture des hapitres de e manus ritdoivent beau oupà diérentes sour esd'informations :

les oursde Master de Mathématiques Appliquéesde l'UniversitéPaulSabatier (Toulouse III) 2

et notamment eux dire tement liés à ette thèse et donnés par Lu a Amodei, Jérémie Bigot, AbdallahChalabi, Cé ile Chouquet, GéraldDesroziers

3

,Pierre Maré hal,Mohamed Masmoudi, Dominikus Noll etJudithVan ostenoble;

les oursd'assimilationdedonnéesduCEPMMT 4

(CentreEuropéenpourlesPrévisions Météoro-logiquesàMoyenTerme)enparti ulier euxdonnéspar ErikAndersson,MagdalenaBalmaseda, Angela Benedetti,CarlaCardinali, Di kDee, Mike Fisher,TonyMa NallyetYanni kTrémolet ainsique lesnotes de ours de Bouttier etCourtier (1999);

les oursduCERFACS 5

donnésparLu Giraud,SergeGratton,XavierVasseur,etlesnombreux séminaires qui yont étédispensés (AndyMoore,PeterOke,...);

les diérentesprésentationslorsdes onféren esWWRP THORPEX Workshopon 4D-Var and EnsembleKalmanFilterInter- omparisons

6

deBuenosAires(novembre2008)etthe5thWMO Symposium on Data Assimilation

7

de Melbourne(O tobre 2009);

les manus rits dethèse de Ri i (2004), Daget (2008)et Pannekou ke (2008).

2

http://www.ups-tlse.fr 3

CNRM: CentreNationaldeRe her hesMétéorologiques: http://www. nrm.meteo.fr 4

ECMWF(EuropeanCentreforMedium-RangeWeatherFore asts):http://www.e mwf.int 5

CentreEuropéendeRe her heet deFormationAvan éeenCal ulS ientique: http://www. erfa s.fr 6

http://4dvarenkf. ima.f en.uba.ar 7

(21)

(22)

Chapitre 1

Un problème inverse : l'assimilation de

données

1.1 Les problèmes inverses

Tout systèmephysique, duplussimple au plus omplexe,peutêtredé ritsil'on onnaît les équa-tionsquilerégissent.Modéliser esystème, 'estdon résoudrenumériquement eséquations.Ne-Zheng (1994) lasseles diérentsmodèles suivant quatre ara téristiques prin ipales:

déterministe / sto hastique :un modèle estdit sto hastique lorsqu'ilfait appel à des variables aléatoires. La sortie de e modèle n'est alors pas unétat déterminé (modèledéterministe) mais une probabilité d'état;

linéaire / nonlinéaire :suivantla linéaritéounon deséquations qui lerégissent;

stationnaire / dynamique :lorsque l'état produit par le modèle évolue dansle temps (le temps fait alors partie desvariables), lemodèle estditdynamique, sinon ilest ditstationnaire; à paramètres rassemblés / distribués:lorsqueles variablessont desfon tions( ontinues ou

dis- rétisées) évoluant dans l'espa e,lemodèle estdità paramètres distribués.

La modélisation d'unsystèmephysique peut permettre d'estimer l'état passé,présent oufutur de esystème,etservirainsiàanalyserouprévoirunévènementdanslesdomaineslesplusvariéstelsque lare her he, lasé urité,laprote tion, lesloisirs....Bien sûrlaperforman ede lamodélisation, 'est àdirelapertinen edelaprévision,dépenddire tement dudegréde onnaissan e deséquations (etde leurrésolution)quirégissentlesystème.D'autrepart,lorsque edernierestmal onnu,samodélisation peutalors également servir àl'étudieren omparant ses prévisionsà laréalité.

De manière générale, un système à paramètres distribués est régi par une ou des équations aux dérivées partielles.Leurrésolution né essitealors les omposantes suivantes (Ne-Zheng,1994):

une région spatiale (paramètresdistribués) etunintervalle detemps (modèledynamique); desparamètres système:ils ara térisent lagéométrie et/ou lanaturephysiquedu système des onditions subsidiaires : elles donnent l'état initial du système ainsi que les relations qui

dé rivent les é hangesde masseou d'énergieave les systèmesvoisins; desvariablesde ontrle

8

:ellesreprésentent l'ex itationdumodèle. Ellespeuvent parfois appa-raîtredans les onditions subsidiaires;

desvariables d'état :ellesdé rivent l'état dusystème.

Mais,lesmodèles sontsoumisàplusieurs sour esd'erreur:dis rétisation,approximationdes équa-tions,hypothèsespastoujoursvalides,mauvaise onnaissan edespro essusphysiques,in ertitudessur

8

(23)

les onditions subsidiaires, .... La solution donnéepar lemodèle n'est don pasexa te, et leserreurs peuvent même s'amplier au ours du temps (dans le as d'un modèle dynamique). Dans e as, ou lorsque la solution s'avère trop impré ise, il peutêtre né essaire d'asservir le modèle par toute te h-nique permettant de le ramener vers la réalité. Toute mesure du système physique, bien qu'enta hée d'erreur, est une expression de ette réalité. Il apparaît don logique de se servir de es observations pour ee tuer ette ta he et orriger ainsides paramètres, onditions ou variables de lamodélisation ommelemontrelagure 1.1.

Fig. 1.1 Modélisation d'unsystème physique

Le problème inverse (voir également Tarantola, 2005) onsiste don , à partir d'un ensemble de mesures observées, à remonter aux paramètres, onditions ou variables qui ont engendrés l'état donné par lemodèle etque l'on ompare à es observations. Ainsi par exemple,en supposant queles observations sont pro hesde l'étatexa t dusystèmephysiqueà uninstantdonné, leproblèmeinverse peut permettre de re aler un paramètre défaillant de la modélisation. La terminologie de problème inverse peut ependant être trompeuse omme le montre Wuns h (1996) sur l'exemple de l'équation dePoisson

△ϕ = ψ.

(1.1)

Eneet,leproblème

(A):évaluer l'équation (1.1)pour trouver

ψ

sa hant

ϕ

,

semblesimple à résoudreetd'unelogique plusdire teque leproblème

(B) :évaluerl'équation (1.1) pour trouver

ϕ

sa hant

ψ

etles onditions auxfrontières,

quiestd'unabordbienplus omplexe.Pourtant 'est edernier problème(B)quiestqualiédedire t ar 'est elui qui est le plus familièrement ren ontré dansde nombreux domaines. Le problème (A),

(24)

Wuns h (1996)pré ise également que(A)n'est pasleseul problèmeinverse à(B).Unautre problème inverse pourrait êtrepar exemple

(C) :évaluer l'équation (1.1)pour trouverles onditions auxfrontières sa hant

ϕ

et

ψ

.

Néanmoins, et bien que l'équation de Poisson pré édente ne le montre pas, une des di ultés majeuresdesproblèmesinversesestqu'ilssont souvent malposésausens deHadamard,i.e.aumoins une des trois onditions suivantes n'est pas respe tée : existen e, uni ité etstabilité. Le non respe t de es onditions estsouvent liéàlaquantité d'informations disponible pour évaluerleproblèmeainsi qu'auxerreurs enta hant les observations.Menke(1989) iteles possibilitéssuivantes :

Problèmes indéterminés (ou sous-déterminés) :lorsque lesystème régissant le problèmeinverse ne fournit pas susamment d'information, le nombre d'in onnues (degrés de liberté) est plus important quele nombre d'équationspermettant de les déterminer. Plusieurs solutions existent alors,violantainsileprin iped'uni ité.Onpourra ependant ompléterlesystèmeparde l'infor-mationa priori,i.e.touteinformation permettant d'anti iper les ara téristiques de lasolution (estimation a priori, signe,four hette devaleurs, approximationde laforme,...).

Problèmesjuste-déterminés:lorsquelesystèmefournittrèsexa tementlaquantitéd'information requise et qu'il n'y a au une singularité, il est alors possible de dénir une solution unique. Cependant,lastabilitédusystèmen'est pasgarantie.Eneet,silesobservations sontenta hées d'erreur, deux séries d'observations distin tes donneront deux solutions diérentes dont l'é art peutêtreimportant. Lasolution n'étant pasreprodu tible, lesystèmeest ditinstable.

Problèmes surdéterminés : lorsque le système fournit plus d'information que né essaire, les er-reurs liéesauxobservations engendrent desin ohéren es etiln'est pluspossiblede al uler une solution. Il sera alors né essairede déterminerdes ritères de séle tion pour en dénir une.

Beau oup de te hniques diérentes existent pour régulariser les problèmes inverses, 'està dire palier le fait qu'ils soient mal posés. La régularisation de Tikhonov en est une des plus élèbres et donne lieu à de multiples variantes. Pour le problème inverse que nous étudions dans les hapitres suivants, laméthode onsistant à minimiser une fon tion oût quadratique, orrespond en fait à une régularisation deTikhonovgénéralisée.Lele teurintéressépourrasereporteràAsteretal.(2005)par exemple, pour une introdu tion pédagogique des problèmes inverses et leur régularisation. A toutes ns utiles, on trouvera enannexe un rappel de ertains outilsmathématiques.

1.2 L'assimilation de données en o éanographie

1.2.1 Le modèle

Leso éansetlemouvement desesmassesd'eauinuen ent fortementungrandnombrede pro es-sus tels que laprodu tivité biogéo himique, les populations marines, le mouvement despolluants ou en ore le hangement limatique et les onditions atmosphériques. Connaître et prévoir leur état est don primordialpour ungrandnombre d'appli ations.

Leur modélisation est ependant omplexe : elle fait appel à la dynamique des uides et doit prendre en ompte les é hanges et intera tions intervenant ave d'autres systèmes omme l'atmo-sphère,les ontinentsetleplan her o éanique, labiogéo himie, les gla esde mer,leruissellement .... Pour dé rire l'o éan dans son ensemble, ou plus généralement l'appareil limatique de la Terre, on faitappelàlamodélisation oupléedesdiérentssystèmes.Dans ettethèse,nousnenousintéressons qu'auxmodèlesde ir ulationgénéraledeso éans(OGCM

9

)pourlesquelsdes onditionsauxfrontières sont spé iéesen lieuet pla edesmodèles ouplés.

(25)

Ces modèles dé rivent l'état dynamique des o éans par des informations (variables d'état) de température (

T

), de salinité (

S

) et de vitesse des ourants ( omposantes zonale

u

et méridienne

v

). Pour représenter la surfa e,plutt que d'utiliser une formulation toit rigide qui onsidère lasurfa e del'o éan ommeunplansurlequelune ertainepressionestappliquée,onpréfèreaujourd'huiutiliser une formulation surfa e libre mettant en ÷uvre une nouvelle variable d'état, la hauteur d'eau en surfa e (

η

). Cette variable permet de dé rire les variations de l'interfa e air-o éan ave plus de réa-lisme.Ces variables d'état orrespondent à ladis rétisation de l'o éansur une grille spatiale (modèle àparamètres distribués) etsont misesà jour selondes intervalles detemps (modèledynamique).

Les OGCM sont basés sur la résolution des équations primitives sur une sphère en rotation, i.e.leséquations de Navier-Stokes auxquelles onajoute une équation d'état reliant les tra eurs a tifs (température etsalinité)àlavitessedu uide,etquel'on résoutsousun ertainnombred'hypothèses (voirparexempleHaidvogeletBe kmann,1999).Ilssont don lairementnonlinéaires. Pour résoudre eséquations primitives, outre des oe ientsdivers (paramètres système) liésà es équations,il est né essairede dénir lagéométrie du domaine (paramètres système), 'est à direles lignes tières et labathymétrie. La ondition initiale ( onditions subsidiaires)est donnée par unétat de l'o éanau temps

t

0

. Lorsque ette ondition initiale orrespond à un état de repos ave une limatologie pour

T

et

S

, on intègre d'abord le modèle sur une ertaine période (spin up) dépendant de la mémoire de l'o éan, avant de l'utiliser pour une appli ation donnée. Cette phase permet à l'o éan modélisé d'oublier sonétat initial peu pré is.Enn, l'o éanetsesfrontières, i.e.la roûte terrestre,les onti-nents, lagla e etl'atmosphère, é hangent des ux de haleur,d'eau dou e, de sel et de moments. Si ertainsde esé hanges ( onditions subsidiaires)peuventêtre négligés,d'autres doivent être paramé-trés(pardestermesderappelpar exemple)ou al ulés.D'autresen ore sontfournis pardesmodèles, que e soitsousforme deproduits(forçages, 'estsouventle aspour lesinformationsatmosphériques tellesquetensiondevent,uxde haleur etuxd'eaudou e)ou dire tement sous formede ouplage.

La modélisationdeso éans onsiste, d'unpoint de vuegrossier, enune réponsedéterministe àun forçageatmosphérique.Cependantleserreursinduitestantpar lesin ertitudesde esforçagesquepar les approximations du modèle, ne peuvent pas être onnues de façon déterministe. En supposant e-pendantque esin ertitudessoientfaiblesetquelamodélisationsoient susammentdèle, eserreurs peuvent êtrereprésentéespar desperturbationssto hastiques(Cohn,1997).Bienque elasoit di ile àréaliseren pratique,Daley(1992) sépare ette erreuren deux omposantes :

l'erreur modèle: liée à la résolution des équations, elle in lut les approximations et simpli- ations de laphysique, les erreurs desalgorithmes numériques (dis rétisation par exemple), les défautsde spé i ation desparamètres etdes onditions auxfrontières.

l'erreur de prévisibilité :elle représente lafaçon dont lemodèle fait évoluer une erreur exis-tantsur la onditioninitiale.

Ainsi,sion onsidèrelemodèle ommeparfait,l'erreur surl'étatqu'il prévoit estdueà une mauvaise onnaissan ede l'étatinitial. Maission onsidèrequel'état initial del'o éanestparfaitement onnu, l'erreursur l'étatissu de lamodélisationest dueaux imperfe tions dumodèle.

1.2.2 Les observations

Pendant longtemps, les seules observations de l'o éan disponibles ont été elles des navires mar- handsetdesmarinesnationales.Bienquen'orantqu'une ouverturedeslignesmaritimesprin ipales, etsouvent limitées à desobservations de surfa e, es mesures, omplétées par elles de ampagnesde re her he etde naviresd'opportunité(volontaires),ontpermisd'établir desbasesdedonnées limato-logiques omme elles de Levitus

10

.Mais es limatologies ne permettent pasde rendre ompte de la variabilitéimportante del'o éansurunelargegamme d'é hellesspatialesettemporelles.Comptetenu de son rle essentiel dansle hangement limatique, la né essitéde mettre en pla e desprogrammes

(26)

internationauxdédiésauxmesureso éaniquesetàl'intera tiono éan/atmosphères'estalors faite sen-tir (Busala hi,1997).

Fig. 1.2 Réseaud'observations o éaniques in situdu programme TOGAen dé embre1994.

En 1985, le programme TOGA 11

a pour obje tif de dé rire la dynamique parti ulière des o éans tropi aux an demieux appréhender desphénomènes ommeEl Niño, ets'intéresse également à l'at-mosphère globale an d'étudier la possibilité de modéliser un système ouplé o éan-atmosphère. Il s'appuie en parti ulier sur le déploiement de bouées amarrées de type ATLAS

12

dans le Pa ique Tropi al. Ce déploiement, baptisé TAO

13

, atteint environ 70 bouées en dé embre 1994, à la n du programme TOGA (voir gure 1.2). Dans le prolongement de e su ès, les programmes GCOS

14 et GOOS

15

sont lan és au début des années 90 an de pérenniser le système d'observation de l'o éan etde l'atmosphère. A partirde 1995, un nouveau programme voit également le jour an d'étudier la variabiliténaturelledu limatetdes hangementsdusàl'a tivitéhumaine :leprogramme CLIVAR

16 . C'est dans e adre qu'un nouveau déploiement de bouées ATLAS est ee tué en 1997 dans l'Atlan-tiqueTropi alsouslenomdePIRATA

17

.Souslamêmeégide,TAOprendlenomdeTAO/TRITONen janvier2000aprèsledéploiementdanslePa iqueOuestdebouéesamarréesTRITON

18

.Aujourd'hui,

11

Tropi al O eanGlobalAtmosphere: http://www.n d .noaa.gov/oa/ oare/toga.html 12

AutonomousTemperatureLine A quisitionSystem 13

Tropi al AtmosphereO ean:http://www.pmel.noaa.gov/tao 14

GlobalClimate ObservingSystem:http://www.wmo.int/pages/prog/g os/ 15

GlobalO eanObservingSystem:http://www.io -goos.org/ 16

ClimateVariabilityandPredi tability:http://www. livar.org/ 17

PilotResear hMooredArrayin theTropi alAtlanti :http://www.brest.ird.fr/pirata/index.php 18

(27)

unnouveau déploiement esten ours dansl'O éan Tropi alIndiensous lenomde RAMA 19

.

Elargissantle hampdesTropiquesàuneperspe tiveplusglobale,leprogrammeWOCE 20

de1990 viseà améliorer la modélisation de la ir ulation générale deso éans pour les prévisions limatiques dé ennales. Entre autres il met en ÷uvre, pour les uxde sub-surfa e, desproleurs (instruments de mesure sur toute ou partie d'une olonne d'eau) de type ALACE

21

qui donneront ensuite naissan e auxproleurs Argo(voirgure1.3).Ledébutdesannées1990 voitaussilelan ement deprogrammes telsque JGOFS

22

qui s'intéressent davantageaux pro essus himiques etbiologiques deso éans.

Fig. 1.3 Déploiement de proleursArgoau 3 janvier2010.

Con ernantlesmesureselles-mêmes,onpeutendistinguerdeuxtypes.Lesdonnéesinsitu onsistent endesmesuresen unpoint,ouen desprolssurtoute ouune partiede la olonned'eau, de tempéra-ture,salinité, vitesseet dire tiondes ourants, pression,dioxyde de arbone, .... Ellessont ee tuées pardiérentessortesd'instrumentstelsquedesthermosalinographes,CTD

23 ,XBT

24

,bouéesamarrées oudérivantes, proleurs,....Maispar equel'o éanestunmilieuparti ulièrement di ile àobserver, esmesuresrestent très hétérogènes.

Le se ond type de données est pourvu par les satellites. Nimbus-7 et Seasat démontraient dans les années 70 les avantages des instruments spatiaux pour une ouverture homogène de la planète. Néanmoins, seule la surfa e des o éans peut être observée, l'o éan profond restant ina essible. Au-jourd'hui,unelargegammedemesuressatellitairesdesurfa esontdisponiblesetpermettentd'obtenir latopographie(Jason-1,ERS-2,...)etlegéoïdeasso ié(GRACE,GOCE),lestempératuresdesurfa e (instrumentsAVHRR,ATSR, ...), la ouleur de l'o éanetdon les teneurs en hlorophylle et phyto-plan ton (Envisat, HY-1), la on entration de gla e de mer (ICESat, CryoSat) ou en ore la salinité (SMOS).Engénéral,des entresdetraitement rassemblentetéventuellement ombinentplusieurs jeux de mesures de type diérent pour obtenir un produitdonné (Coriolis

25

pour des bases de données in situ, GHRSST

26

pour des produits ombinés de température de surfa e, ...) et ee tuent ainsi une première validation des observations. La gure 1.4présente leréseau de satellites d'observation pour

19

Resear hMooredArrayforAfri an-Asian-AustralianMonsoonAnalysisandPredi tion 20

WorldO eanCir ulationExperiment:http://wo e.nod .noaa.gov/wdiu/index.htm 21

AutonomousLagrangianCir ulationExplorer 22

JointGlobal O eanFluxStudy:http://ijgofs.whoi.edu/ 23

Condu tivityTemperatureDepth 24

ExpendableBathythermographe 25

http://www. oriolis.eu.org/ 26

(28)

lamétéorologie etl'o éanographiede laNASA 27

.

Fig. 1.4 Réseaud'observations satellite pour lamétéorologieetl'o éanographie delaNASA.

Une ondition indispensable aux prévisions o éaniques réalistes (et aux diverses appli ations qui leur sont liées) est qu'il soit possible d'exploiter un système d'observation pérenne, délivrant de fa-çon régulière des informations susamment ri hes et diversiées. C'est à partir de e onstat que le programme GODAE

28

, initié en 1997, s'eor e de donner des bases solides à une o éanographie opérationnelle.Asanen 2008,l'expérien elaissepla eàdessystèmesmaturesdeprévisionà mésoé- helle opérationnels tels que Mer ator O éan

29 (Fran e), NCOF 30 (UK), BLUElink 31 (Australie), et desprojetsinternationaux ommeMyO ean

32

pourlamiseàdispositiondeproduitso éaniquesvariés.

Cependant, toute observation, qu'elle soit in situ, satellitaire ou ombinée, est sujette à une er-reur de mesureliée à l'instrument lui-même(dénition, mauvaise alibration, dérives,...)ou àson enregistrementetsa ommuni ation( odage in orre t,défautdetransmission, ...).Dans ertains as, etteerreur peutêtreaberranteetl'observationdoitêtrerejetée,dansd'autres,lamesuresoured'un biais systématique.Il est don indispensable de mettre en pla e un ontrle e a e de la qualité des observations (Kalnay, 2003). Ce ontrle n'ayant ependant pasde prise surle ara tère aléatoire des erreurs, ilne peutdon pasgarantir l'intégrité omplète desdonnées.

1.2.3 Comparaison modèle / observations

Engénéral, iln'estpaspossiblede omparerdire tement l'étatprévupar lemodèleave les obser-vations.Eneet,iln'estpasréalistede supposerquelagrillede dis rétisation(spatialeettemporelle)

27

NationalAeronauti sandSpa e Administration: http:// limate.nasa.gov/ 28

GlobalO eanDataAssimilationExperiment:http://www.godae.org/ 29

http://www.mer ator-o ean.fr/ 30

NationalCenterforO eanFore asting:http://www.n of. o.uk/ 31

http://www.marine. siro.au/bluelink/ 32

(29)

dumodèlepuisse orrespondreexa tement auxempla ementset auxinstantsdemesuredesdiérents instruments.D'autrepart,lesvariablesd'état dumodèlepeuventnepas orrespondredire tementaux grandeurs mesurées maispeuvent leur être liéespar desrelations physiquesplus ou moins omplexes. Unsatellite mesurepar exemple laradian e émisepar laTerre,etlarelieà latempérature de surfa e grâ eàl'équation de transfertradiatif.

Modèle et observations sont don dénis dans deux espa es diérents. Pour pouvoir ee tuer la omparaison,ondénit unopérateur d'observation permettant de passerdel'espa e du modèle àl'espa e des observations.Onpeutalors al ulerl'innovation,i.e.l'é artqui existeentre les ob-servationsetl'étatdumodèleramenédansl'espa edesobservations.C'estàpartirde etteinnovation qu'une orre tion peutêtre al uléepar leproblèmeinverse. Cependant,l'opérateur d'observation, en fon tiondesanature, estsujetàune erreurd'interpolation omprenant l'aspe tinterpolation pro-prement ditmaiségalement lesaspe tsdis rétisationetéquivalen e desvariables(résoudrel'équation detransfert radiatifpar exemple n'est pastrivial).

Le fait que lemodèle et les observations soient dénis dansdeux espa esdiérents estégalement sour e d'unautre type d'erreur. En eet,les observations ontiennent des informations provenant de pro essusphysiquesdediérentesé helles,y omprisd'é hellestroppetitespourêtreprisesen ompte parlarésolution lemodèle. C'est ette inadéquation ave larésolution dumodèle quigénère l'erreur dereprésentativité (Janji¢etCohn,2006).Ellepeutêtrerelativement importanteetmêmedominer leserreursde mesureetd'interpolation lorsquelemodèleutilisé est àbasse résolution.

1.2.4 Le problème inverse

Si onnaître l'état de l'o éan ave exa titude à tout instant donné relève de l'utopie, il est e-pendant possible de s'enrappro her susamment pour endonner unereprésentation ohérente. Pour prendre en ompte l'erreur de représentativité, il onvient d'augmenter les résolutions et d'améliorer laphysique à petiteé helle. L'assimilationde données ne peut don pasagir sur e type d'erreur. En revan he, elle permet de réduire l'erreur de prévisibilité et éventuellement d'estimer l'erreur modèle toutentenant omptedeserreursliéesauxobservations.I i,leproblèmeinversevadon orrigerl'état initialpour obtenir une prévisionpluspro he dela réalité.

Le ve teur d'état d'un OGCMest généralement de grande taille (

≈ 10

6

éléments pour un modèle basse résolution). Bien que le système d'observation se soit onsidérablement amélioré au ours des années, iln'en reste pasmoins quelenombre d'observations sur une période de omparaison donnée, est bien inférieur à la taille de e ve teur état, e qui fait de l'assimilation de données dans e as un problème sous-déterminé

33

.Une solution naturelle est alors de onsidérer que l'état donné par le modèlelui-même onstitue uneapproximation delaréalité etpeutdon servir d'information a priori. Dans e as, etétatestappeléébau hetandisquel'état orrigéaprèsappli ationduproblèmeinverse est appelé analyse. Augmenté de l'ébau he, le problème est alors surdéterminé, et ompte tenu des in ertitudes liées tant aux observations qu'au modèle, il n'est généralement plus possible de trouver unesolution qui respe te toutes lesinformations fournies. Il onvient alors de dénirdes ritères per-mettant de déterminermalgré toutune solution.

De manière générale, les variables de ontrle, i.e. les éléments sur lesquels on agit par l'in-termédiaire du problème inverse, sont les mêmes que les variables d'état. Cependant, on peut hoisir de n'ee tuer des orre tions que sur une partie de es variables, soit pour des raisons de oût, soit par eque ertainesvariables sont di ilesàprendre en ompte,soit en ore par equel'onsait dénir entreellesdesrelationsdedépendan e.Onpeuten ore hoisirde ontrlerenplus ertainsparamètres

33

On notera ependantquelesobservationsn'étanthomogènesni spatialement,ni temporellement,ilexiste des régions lo alementdenses en observations pour ertainesvariables et pour lesquelles il est don possible

(30)

ou forçages. On distinguera don l'espa e des variables de ontrle de l'espa e des variables d'état.

1.3 Les diérentes te hniques pour l'o éanographie et la

météorologie

Les méthodes d'assimilation de données ont, de manière générale, été développées dans le adre de lamétéorologie avant d'être adaptées à l'o éanographie. L'historique qui suit se on entre sur les diérenteste hniquesetnonsurlesdomainesd'appli ationparti uliers. C'estpourquoi,on ytrouvera desréféren es de météorologieaussibien qued'o éanographie sansdistin tion expli ite.

1.3.1 Un bref historique

En assimilation de données, les météorologues sont les premiers à tenter de se servir des observa-tionspouraméliorerleursprévisionsgrâ eàdespro éduresditesd'analyseobje tive, arnereposant pas sur le jugement (subje tif) d'unanalyste. Cressman (1959) reprend la méthode de Bergthórsson etDöös(1955)etproposeunalgorithmesimplede orre tions su essivesdel'ébau he enfon tion des observations. Pour ela, haque fois qu'une observation est disponible, les valeurs des points de grille du modèle pro hes sont interpolées jusqu'à e point d'observation pour en al uler l'é art. La orre tionappliquéeen haquepointdegrilleestalorsdénieparl'innovationadéquateramenéesurle pointde grille d'origine etae tée d'unpoids dé roissant ave l'augmentation de ladistan edu point de grille àl'observation.Cette dé roissan eest maîtrisée par unparamètre permettant de déterminer à partir de quelle distan e l'observation n'a plus d'inuen e. Mais un des in onvénients majeurs des méthodes de orre tions su essives vient du fait que la fon tion poids utilisée est arbitraire et ne tient pas ompte des qualités respe tives de l'ébau he et des observations, risquant par exemple de dégraderunebonneestimationdumodèleenyasso iantdesmesuresphysiquesmédio res.Deplus,les orre tionsapportéespeuvent nepas respe ter les ara téristiques physiques dusystème, en générant par exemple dessauts dansun hamp, ouen détruisant l'équilibre entre deuxvariables.

Gandin (1963) propose alors uneméthode où la orre tion à apporter enun point de grilledonné estdéterminée par lesé artsentre e pointde grilleetunensembled'observations autourde epoint, asso iés à un poids al ulé en fon tion de statistiques sur les diérentes erreurs. Cette méthode, dite d'interpolation statistique ouinterpolation optimale (OI

34

) et samise en÷uvre pratique pour lesproblèmes àgrandetaille (Loren ,1981)aétélargement utiliséepoursasimpli itéetson oût rai-sonnable.Néanmoins,un desin onvénients delate hnique vientdu besoin dedé omposerledomaine d'analyseenplusieurssous-domaines.L'inuen edesobservationsestalorsréduiteàleursous-domaine d'ae tation etun bruit parasite en résulte aux frontières. De plus, la ohéren e des petites é helles ave des é helles plus grandes n'est plus garantie. Enn, l'utilisation d'opérateurs d'observation non linéairess'avèreproblématique.

Alamêmeépoque, Kalman(1960)etKalmanetBu y(1961)dé riventunestimateurdis retpour dessystèmes linéaires ou des équations diérentielles ordinaires. Ce ltre sera en parti ulier appliqué ave su èspour le al ul de traje toires du programme Apollo. Etudié en météorologie à partir des années 1980 (Ghil et al., 1981), il permet de orriger, à haque pas de temps, le ve teur d'état du modèle à partir du ve teur d'innovation multiplié par une matri e, appelée matri e de gain, for-mulée à partir de statistiques ( ovarian es) sur les diérentes erreurs. Si la te hnique est similaire à elle de l'OI, leltre de Kalman (KF

35

) s'applique au domaine omplet et permetde propager les ovarian es d'erreur du pas de temps pré édent grâ e au modèle dynamique. Mais les modèles étant

34

OptimalInterpolation 35

(31)

nonlinéaires, leséquations doivent êtrelinéarisées pourlapropagationdeserreurs, et à onditionque es non-linéarités soient faibles (Jazwinski, 1970; Evensen, 2007), la méthode, bien que perdant son optimalité,reste satisfaisante. Cettete hnique est onnue sous lenomde ltre de Kalman étendu (EKF

36

).Néanmoins les problèmes d'assimilation de données, tant en météorologie qu'en o éanogra-phie, étant de grande dimension, onstruire la matri e de gain et propager les statistiques n'est pas réalisable. Des méthodesde rang réduit pour approximer le ltre de Kalman ont alors été dévelop-pées(FukumorietMalanotte-Rizzoli,1995; BuehneretMalanotte-Rizzoli, 2003). Le prin ipeestbasé surla rédu tion des matri es de ovarian es d'erreur à des matri es de rang plus faible mais restant signi atif. On itera par exemple le ltre SEEK

37

introduit par Pham et al. (1998). Pour palier le problèmedelapropagationdes ovarian es,onpeutaussi hoisirdelesestimer àpartird'unensemble d'é hantillons. Pour ela,onappliquel'opérateurdepropagationdumodèlenonlinéaireaumêmeétat plusieurs fois, mais en perturbant un élément diéremment à haque fois. Les résultats onstituent unensemblepermettant de al ulerles ovarian es d'erreur(Evensen, 2007)qui sont alors appliquées dansle al ul de l'analyse. Cetteméthode est appelée ltre de Kalman d'ensemble (EnKF

38 ) (le prin ipedesméthodesd'ensemblesera pré iséau hapitre 3).

Lesappro hesprésentées i-dessussontdesappro hesd'assimilationséquentielle.Pour es mé-thodes, la prévision peut être miseà jour dès qu'une observation est disponible. Mais ette appro he ne permetaux observations que de orriger les états suivants et jamais les états pré édents. La pro-pagation de l'information ontenue dans les observations ne peut don s'ee tuer que du passé vers lefutur, et jamaisdu futur vers le passé. Si etin onvénient n'est pas déterminant dans le adre de prévisionspuisqu'elles demandent une intégration dumodèle verslefutur, ilest majeurdansle adre d'unexer i e de réanalyse. Pour palier le problème, la méthode du Kalman smoother (voir par exempleMénardetDaley,1996) permetde revenir versle passéaprès qu'uneanalyse verslefuturait étéfaite.

Parallèlement aux méthodesexposées pré édemment, Sasaki (1958) proposequant àlui, d'établir une analyse obje tive à partir d'une méthode variationnelle, i.e. de minimiser la distan e aux obser-vations tout en respe tant une ertaine ontrainte dynamique. En parti ulier, Sasaki (1970) dénit la notion de ontrainte forte lorsque ette ontrainte doit être satisfaite exa tement, et la notion de ontrainte faible lorsqu'elle l'est de manière approximative. Plus ohérente puisque prenant en ompte des ontraintes physiques, ette méthode reste néanmoins oûteuse. Le Dimet et Talagrand (1986) proposent alors desméthodes itératives pour résoudrele problème, et montrent en parti ulier omment l'utilisation du modèle adjoint (voir Annexe A et paragraphe 2.4.3) permet de réduire les oûts.On parlede 3D-Varlorsquel'aspe t temporel n'est paspris en ompte etde 4D-Varsinon.

Al'inverse des méthodes séquentielles, l'assimilation variationnelle permet, lorsque lavariable temps est in luse (4D-Var), de prendre en ompte les observations sur une période donnée de façon globale. En eet,on obtient alors une orre tion non plus de l'état du modèleen fon tion des obser-vations disponibles à l'instant donné, maisde latraje toire de l'état en fon tion des observations disponiblessurl'ensembled'unepériode donnée.Le détailde ette méthode seradonné au hapitre 2.

Aujourd'hui, laplupartdesgrands entres demétéorologie utilisent unsystème4D-Var pour leurs prévisionsopérationnelles (Rabier etal.,2000;Gauthier etal.,2007;Rawlinset al.,2007).En o éano-graphie,depuis les premières tentatives d'implémentation onduites par Tha ker et Long (1988), des systèmesvariationnels(3D-Var ou4D-Var)ontétémis en÷uvreaussibienpourdessystèmesglobaux (Stammer et al.,2002; Daget et al., 2009;Mogensen et al., 2009)que régionaux (Weaver et al.,2003; DiLorenzo etal., 2007;Dobri i etPinardi,2008; Liet al.,2008).

36

ExtendedKalmanFilter 37

SingularEvolutiveExtendedKalmanFilter 38

(32)

Leste hniquesd'assimilationséquentielle etvariationnelle utilisent desformulations deproblèmes inverses pour al uler une orre tion à appliquer à l'ébau he. Néanmoins, le problème dire t peut être formulépar desfon tionsde densitéde probabilité onditionnelles (voirparagraphe 2.1),et il est alors possiblede montrer que ladistribution a posteriori peutêtre al ulée à partir d'unensemblede parti ulesquel'onfaitévolueràtraverslemodèle.Chaqueparti ulereprésenteladensitédeprobabilité a priori et est ae tée d'un poids al ulé a posteriori par rapport à la densité de probabilité des observationssa hantl'état. Cettete hnique desltres parti ulairesestappliquéedansle adred'un modèle o éanique (régiondu ourant des Aiguilles) par Van Leeuwen (2003), qui note ependant une fortetendan edel'ensembleàs'eondrer,i.e.àparveniràunesituationdanslaquelleunseulmembre de l'ensemble se voit ae ter de presque tout le poids a posteriori. Cette tendan e est onrmée par Snyder et al. (2008)pour lesproblèmes à grandedimension.

1.3.2 L'assimilation aujourd'hui

D'unpoint devuealgorithmique, ondistinguedeux grandesfamillesd'assimilation:l'assimilation séquentielle (OI et EnKF prin ipalement) et l'assimilation variationnelle (3D-Var et 4D-Var). Mais quelque soit la méthode utilisée, les di ultés et questions auxquelles est onfronté l'assimilation de données peuvent être résuméespar les pointssuivants:

la dimension du problème : la prise en ompte des pro essus physiques à des é helles de plus en plus petites né essite l'augmentation de la résolution des modèles, etdon la dimension du ve teur d'état, entrainant alors un besoin toujours plus grand tant en mémoire qu'en vitesse de al ul. L'utilisation de al ulateurs à haute performan e répond en partie à ette ontrainte mais lefa teur de rédu tiondestemps de al uls n'est pasproportionnel au nombre de pro es-seurs utilisés (voir par exemple Dowd etSeveran e, 1998). Mettre en ÷uvredesalgorithmes de résolution e a es reste don unepriorité.

les ontraintes d'équilibre : en o éanographie omme en météorologie, des relations physiques plus ou moins omplexes existent entreles diérentes variables. Ces dernières ne sont don pas indépendantes lesunesdesautres maisobéissentà des ontraintes d'équilibre.On iterapar exemplel'équilibregéostrophiquemaisaussilesrelationsdelathermodynamique.Ilestimpératif pour l'assimilation de données de prendre en ompte es ontraintes an d'obtenir une analyse physiquement ohérente (DerberetBouttier,1999; Weaver et al.,2005).

le ontrle dequalité: ommementionné auparagraphe 1.2.2,ilestindispensablequeles obser-vations assimiléessoient d'unequalitésusante. Leur ontrle estdon une étapeindispensable à l'assimilation dedonnées.

la orre tion de biais :tout système d'assimilationest ae té par des biaisréduisant laqualité de l'analyse,que eux- i proviennent du modèle lui-même, de es onditions auxfrontières, des observations et de leurs opérateurs, .... La di ulté de la orre tion d'un biais ne réside pas tant danslaméthode numérique elle-même que dansl'identi ation orre tede sasour e (Dee, 2005; Balmasedaetal., 2007).

lesnon-linéaritésetlesdistributions non-gaussiennes:lesmodèlesainsiquelesopérateurs d'ob-servation sont généralement non linéaires. Si es non-linéarités ne sont pas trop sévères, il est possible de leslinéariser. Mais lorsqu'elles sont trop fortes,d'autres te hniques doivent être en-visagées. De plus, pour les méthodes variationnelles, l'hypothèse d'une distribution gaussienne surlesdensitésdeprobabilité onditionnellesestfaite,malgréson ara tèrerestri tif(voir para-graphe 2.1.3). Prendre en ompte desstru tures nongaussiennes etdesnon-linéarités, qui sont souvent liéeslesunes auxautres,est undes hallenges del'assimilation de données.

la validation : rendre ompte de l'impa t de l'assimilation de données est malaisé puisque ela né essite d'évaluer la pré ision ave laquelle l'état de l'o éan (ou de l'atmosphère) est donné, pré isionévaluéeparrapportàunétatvraiqu'iln'estjamaispossiblede onnaîtreparfaitement. La miseen pla e par exemple de diagnosti sde ohéren e (Desroziers etal., 2005)peutaider à

(33)

Chaquete hnique d'assimilationasaproprefaçondegérerlesdiverspointsévoqués(Loren ,2003; Kalnay et al., 2007a). Loren (1986) note ependant qu'au une des méthodes ouramment utilisées n'estidéale en toutpoint etquelapréféren equel'ona orde àl'une pluttqu'une autredépend des ara téristiques que l'on onsidère omme les plus importantes. Plutt que de omparer le 4D-Var à l'EnKF,Gustafsson(2007)suggère des'intéresser davantageà omment ombiner lesdiérentes idées sous-ja entes de es méthodes (voir aussiKalnay et al.,2007b). Aujourd'hui e thème estdevenu une a tivitéde re her he très importante(Belo Pereira etBerre, 2006; Daget et al., 2009;Buehner et al., 2009a,b).

(34)

Chapitre 2

L'assimilation variationnelle

Lesdéveloppementsee tués dansle adrede ette thèses'appliquent àunsystèmed'assimilation variationnel.C'estpourquoi,seule etteméthodeestdé riteendétaildans e hapitre.Cetteméthode va permettre i i de orriger la ondition initiale du modèle en ombinant les informations fournies d'une part par des mesures du milieu o éanique, et d'autre part par l'ébau he du modèle en tant qu'informationa priori.

2.1 Formalisme du problème

L'idée de Sasaki (1958, 1970) est de formuler une analyse obje tive qui permette de produire un hampminimisantladistan eauxobservationstoutensatisfaisantune ontraintedynamiqueexpli ite.

2.1.1 Problème ontinu

Prenons unsystèmedeplusieurs équationsdiérentielles

S(ϕ)

où

ϕ

estunefon tiondépendant de oordonnées spatiales ettemporelle(par exemple la fon tion température de l'o éan). Sur un ertain domaine

Ω

,etétant donné la onditioninitiale

ϕ

0

,lesystème doitvérier

S(ϕ) = 0.

(2.1)

Fig. 2.1 Système S.

Si la ondition initiale

ϕ

0

n'est pas onnue ave ertitude, larésolution du système

(S)

ne donne pasàl'instant

T

lafon tion

ϕ

exa te. Supposons maintenant qu'il existe unefon tion

ϕ

˜

disponibleet représentantunebonneestimationsurledomaine

Ω

de ettefon tionexa teàuninstant

t

∈]0, T [

.Pour etexemplesimple,on onsidèrera que

ϕ

et

ϕ

˜

sont déniesdanslemême espa e.Onva alors her her

(35)

àréajuster

ϕ

0

pour réduireau maximum l'é art quadratiqueentre

ϕ

etl'estimation

ϕ

˜

(te hnique des moindres arrés). Le problème variationnel

(P

c

)

s'é rit alors

(P

c

)

Trouver

ϕ(x, t)

qui minimise lafon tion

J(ϕ) =

R

Ω

(ϕ

− ˜

ϕ)

2 dΩ

Sousla ontrainte

S(ϕ) = 0

.

(2.2)

S(ϕ) = 0

représentela ontrainteduproblèmedeminimisationtandisque

J(ϕ)

estappeléefon tion oût ou fon tionnelle. Si on peut munir l'espa e dans lequel est déni la fon tion

ϕ

d'une norme issueduproduits alaire

L

2

lassique,

J(ϕ)

est alors dé ritepar le arré de lanorme

L

2 J(ϕ) =

||ϕ − ˜

ϕ

||

2 L

2 .

(2.3)

2.1.2 Problème dis ret

Bien qu'ilsoit intéressant de garder en mémoire lanature du problème ontinu, notre appli ation seprésente en fait sous laforme d'un problème dis ret. Lesfon tions

ϕ

et

ϕ

˜

pré édentes seront don représentées souslaforme deve teurs àvaleursdansIR.

L'état dumodèle estdonnépar plusieurs hampss alairesmaissera dénisouslaformed'unseul ve teur

x

=

x

T

₁

x

T

₂

. . .

T

où haque ve teur

x

1

,

x

2

,

. . .

représente un de es hamps (température, salinité,hauteurd'eau,...).Ilenserademêmepourlesobservations,quelquesoitleurnature.Deplus, lesespa esrespe tifsdumodèleetdesobservations n'étantpasidentiques,ilfaut dénirunopérateur d'observationqui permettra de passerdu premierau se ond.

Ondénit ainsidansl'espa edu modèleles ve teurs dedimension

n

:

x

t

: valeursau point de grille dumodèlede l'étatvrai ontinu de l'o éanque l'on her he à appro herau plusprès;

x

b

: ébau he, information a priori fournie par lemodèlesurl'état de l'o éan;

x

a

: analyse, ébau he orrigée après assimilationdesobservations.

Ces ve teurs ontiennent les variables de ontrle dénies sur la grille du modèle, 'est à dire les élé-ments que l'on souhaite orriger grâ e au problème inverse. Ils peuvent don ontenir tout ou partie desvariables d'état aussi bienque des paramètres divers du système. Néanmoins,le but de notre as-similation de données étant de orriger l'erreur de prévisibilitédu modèle, i.e.la ondition initiale, il nesera pasfaitmention i i de orre tion de paramètres.

On suppose que l'on veut estimer l'état du système sur une période

t

0 ≤ t

i

≤ t

N

donnée. Cette périodeest appelée fenêtreou y le d'assimilation. Ondénit alorsdansl'espa e desobservations leve teur dedimension

p

:

y

o

=

y

o

₀

T

. . . y

o

N

T

:observations de l'o éansurlapériode donnée,

ave les ve teursde dimension

p

i

:

y

o

_i

:observations del'o éanà l'instant

t

i

.

Cesobservations orrespondentauxmesuresee tuéespendantlafenêtred'assimilation.Ellespeuvent êtredetouttype(insitu,satelliteouproduit),dire tes(variablesidentiquesà ellesdumodèle)ou in-dire tes(variablesen relationave ellesdumodèle)etreprésentent lesmesuresee tuées.Lenombre de esmesures peutêtrediérent à l'instant