• Aucun résultat trouvé

6.4 Probl`eme non-Gaussien et observations hautes fr´equences

6.4.2 Dispersion, fiabilit´e, r´esolution

Bien que le sujet des qualit´es requises pour un ensemble ait ´et´e discut´e au Chapitre 1 (Sec. 2.3.1), nous rappelons que la fiabilit´e (coh´erence statistique) est une condition n´ecessaire `a la Bayesianit´e d’un ensemble. La dispersion d’un ensemble est, elle-mˆeme, condition n´ecessaire `a la fiabilit´e. Et la r´esolution (qualit´e informative) d’un

ensemble est une notion compl´ementaire sur la qualit´e de l’ensemble.

Nous avons vu dans la section pr´ec´edente que l’ensemble g´en´er´e par le MRHF dans la configuration P2S6 pr´esentait une l´eg`ere sous-dispersion. Cette sous-dispersion peut ˆetre due `a des corrections trop fortes sur l’ensemble `a chaque observation satel-lite. Dans ce cas, des observations satellites fr´equentes ne laisseraient pas le temps au syst`eme de correctement re-disperser l’ensemble ce qui pourrait engendrer un effondrement de ce dernier.

La question que l’on se pose est donc : comment se comportent les ensembles ETKF et MRHF face `a un probl`eme non-Gaussien pour des donn´ees hautes fr´equences ?

Pour r´epondre `a cette question, nous consid´erons d’abord la dispersion des en-sembles visuellement et au travers d’histogrammes de rangs. Nous ´evaluons ensuite la fiabilit´e et la r´esolution avec le Continuous Rank Probability Score (CRPS), un diagnostic pr´esent´e en Section 2.3.1.

Figure 6.20 – S´eries temporelles de la temp´erature de surface pour les ensembles (en bleu) de l’ETKF (panneau de gauche) et de l’ETKF-MRHF (panneau de droite) et la v´erit´e (en rouge) dans la configuration P2S05 (la plus observ´ee).

Dispersion de l’ensemble

La Figure 6.20 montre les s´eries temporelles de la temp´erature de surface pour les ensembles de l’ETKF (panneau de gauche) et de l’ETKF-MRHF (panneau de droite) compar´ees `a la v´erit´e dans la configuration la plus observ´ee : un profil tous les deux jours et la SST toutes les demi-heures (P2S05).

6.4. Probl`eme non-Gaussien et observations hautes fr´equences 179

Il s’agit donc de regarder la correction d’une variable peu non-Gaussienne en un point de grille directement observ´e. Pour ce type de probl`eme direct et peu non-Gaussien, le filtre de Kalman d’ensemble est une r´ef´erence. Toutefois, on constate que les deux ensembles produits par l’ETKF et le MRHF sont tr`es similaires et estiment bien la v´erit´e. `A partir du 10`eme jour, on observe mˆeme une dispersion moindre de l’ensemble MRHF autour de la v´erit´e.

La Figure 6.21 pr´esente les histogrammes de rangs de phytoplancton, sur le mois d’avril et sur les 200 premiers m`etres de la colonne d’eau, pour les diff´erentes confi-gurations : P2S6 (ligne 1), P2S3 (ligne 2), P2S1 (ligne 3), P2S05 (ligne 4) et P0S05 (ligne 5). Les histogrammes de gauche (en rouge) sont ceux des ensembles g´en´er´es par l’ETKF et les histogrammes de droite (en bleu) ceux des ensembles g´en´er´es par le MRHF.

Les histogrammes de l’ETKF (en rouge) montrent que l’assimilation ne parvient pour aucun r´eseau d’observations `a corriger les biais de sous-estimation du phyto-plancton. On voit ´egalement, que l’ensemble ETKF devient sous dispersif pour des observations satellites `a 30 minutes.

Comme il ´etait pr´evisible, la l´eg`ere sous dispersion de l’ensemble MRHF en confi-guration P2S6 s’intensifie lorsque la fr´equence d’observations augmente. Les histo-grammes de toutes les configurations pr´esentent une forte sous-dispersion.

Pour confirmer ces r´esultats nous utilisons `a pr´esent le CRPS qui nous donnera deux informations sur l’ensemble : la fiabilit´e et la r´esolution.

Fiabilit´e et r´esolution

Pour ´evaluer la fiabilit´e et la r´esolution (et l’incertitude) associ´ees `a nos ensemble nous utilisons la d´ecomposition de Hersbach (2000) d´ecrite en Section 2.3.1. Nous regardons deux indices : le terme de fiabilit´e “REL” et la somme des termes de r´esolution et d’incertitude appel´ee “CRPSpot”. Le CRPSpotest le CRPS potentiel qui peut ˆetre vu comme la r´esolution d’un ensemble si sa fiabilit´e ´etait parfaite.

Nous avons donc deux indices, l’un d´ecrivant la coh´erence statistique de l’ensemble et l’autre donnant l’apport d’information de l’ensemble si l’ensemble ´etait statisti-quement coh´erent.

Un faible indice REL correspond `a une bonne fiabilit´e de l’ensemble. De mˆeme, un faible indice CRPSpot, ´equivaut `a un bon CRPS potentiel, c’est `a dire une bonne r´esolution si REL ´etait nul. De mani`ere globale, une faible valeur CRPS indique une bonne fiabilit´e et une bonne r´esolution.

Figure 6.21 – Histogrammes de rangs, sur le mois d’avril, du phytoplancton total pour les r´eseaux d’observations P2S6 (ligne 1), P2S3 (ligne 2), P2S1 (ligne 3), P2S05 (ligne 4) et P0S05 (ligne 5). Les histogrammes des ensembles ETKF sont en rouge (colonne 1) et ceux des ensembles MRHF sont en bleu (colonne 2). La barre noire symbolise l’histogramme plat (dispersion parfaite).

6.4. Probl`eme non-Gaussien et observations hautes fr´equences 181

Figure 6.22 – CRPS sur le mois de la variable temp´erature (panneaux sup´erieurs), du phyto-plancton (panneaux centraux), du nitrate (panneaux inf´erieurs) des ensembles analys´es produits par l’ETKF (panneaux de gauche) et par le MRHF (panneaux de droite) pour les r´eseaux d’observations P2S6, P2S3, P2S1, P2S05 et P0S05.

La Figure 6.22 est constitu´ee de diagrammes pr´esentant le CRPS comme la somme de REL (en bleu) et de CRPSpot (en orange) et ce pour les diff´erentes configurations. Ces CRPS sont calcul´es pour la temp´erature (ligne 1), pour le phytoplancton (ligne 2) et pour le nitrate (ligne 3). On ´etudie l’ensemble issu de l’analyse ETKF (colonne 1) et l’ensemble issu de l’analyse MRHF (colonne 2).

La premi`ere observation est que, pour toutes les variables, la fiabilit´e des ensembles ETKF est globalement meilleure (REL plus petit) que celle des ensembles MRHF. Ceci confirme la sous-dispersion des ensembles observ´ee pr´ec´edemment.

Bien que la fiabilit´e soit toujours moins bonne pour le MRHF, le score CRPS total ne varie que peu entre l’ETKF et le MRHF pour la variable temp´erature. Les CRPS des deux m´ethodes sont presque ´egaux pour le phytoplancton et celui du MRHF est plus faible pour le nitrate.

Le faible CRPS potentiel des ensembles MRHF, indique qu’il serait tr`es int´eressant de travailler `a am´eliorer la fiabilit´e des ensembles. En effet, l’utilisation du MRHF pr´esente d´ej`a l’avantage de fournir des erreurs RMS faibles sur les variables biog´eochimiques mais on voit ´egalement que pour un ensemble fiable l’information ensembliste pro-duite par le MRHF est plus pertinente que celle de l’ETKF.

En r´esum´e, la mauvaise dispersion des ensembles produits par le MRHF pour des observations hautes fr´equences est inqui´etante. Cette mauvaise dispersion a ´et´e confirm´ee par des diagnostics CRPS indiquant une mauvaise fiabilit´e.

Toutefois, les bons r´esultats du MRHF en terme d’erreurs RMS et de r´esolution motivent `a essayer d’am´eliorer la fiabilit´e des ensembles analys´es. Il s’agit notamment d’une des perspectives importantes `a ce travail.

6.4.3 Bilan

Employer une m´ethode dite non-Gaussienne ne suffit pas pour r´esoudre un probl`eme contenant de fortes non-Gaussianit´es. Plusieurs pr´ecautions sont `a prendre. La conclu-sion `a tirer de cette sous partie est notamment que dans ce contexte particulier d’ob-servations satellites si le r´eseau temporel d’obd’ob-servations est trop dense les m´ethodes non-Gaussiennes peuvent g´en´erer des ensembles trop sous dispersifs. En effet, cer-taines m´ethodes non-Gaussiennes sont victimes de la mal´ediction de la dimensiona-lit´e. Le MRHF est moins soumis `a ce probl`eme que, par exemple, les filtres parti-culaires puisqu’il s’agit d’une m´ethode de transport (i.e. d´epla¸cant les membres vers la solution) et non de s´el´ection. Repr´esenter des densit´es de probabilit´es en grande dimension avec une ensemble de petite taille reste difficile et une succession de cor-rection peut d´egrader la repr´esentation des densit´es par l’ensemble. Ceci se produit

6.5. Conclusions 183

lorsque l’espace des solutions est grand devant l’espace explor´e par l’ensemble. Et chaque nouvelle observation va restreindre encore plus l’espace des solutions bien sˆur mais ´egalement l’espace explor´e par l’ensemble. Un r´eseau d’observation trop dense peut donc avoir pour cons´equence, ce que l’on constate ici, de r´eduire l’espace ex-plor´e jusqu’`a ce qu’on appelle l’effondrement (collapse) de l’ensemble. Des techniques pour corriger (temporairement) ce probl`eme peuvent ˆetre par exemple d’augmenter la taille de l’ensemble, d’utiliser de l’inflation ou de la localisation.

6.5 Conclusions

Dans ce chapitre l’´etude d’un probl`eme d’assimilation de donn´ees avec le mod`ele ModECOGeL est r´ealis´ee. Cette ´etude combine plusieurs caract´eristiques particuli`eres : l’utilisation d’un mod`ele coupl´e dynamique/biog´eochimie marine, la g´en´eration de l’ensemble par perturbations stochastiques du for¸cage vent, l’utilisation d’une m´ethode d’assimilation non-Gaussienne, les diff´erents r´eseaux d’observations utilis´es. Il en res-sort de nombreuses conclusions que l’on ´enonce dans cette section.

Une ´etude a priori de caract´erisation du probl`eme d’assimilation, au re-gard de la non-Gaussianit´e, doit ˆetre effectu´ee afin de choisir la m´ethode d’assimilation la plus adapt´ee.En effet, une simple ´evaluation du caract`ere plus ou moins Gaussien des probl`emes d’assimilation dans la premi`ere section de ce cha-pitre (Section 6.1), nous a permis d’identifier la qualit´e quasi-Gaussienne du probl`eme de contrˆole de la dynamique seule et la qualit´e clairement non-Gaussienne du contrˆole du phytoplancton `a l’aide d’observations de temp´erature et de salinit´e. Ces deux degr´es de Gaussianit´e se sont confirm´es lors de la r´ealisation d’exp´eriences d’assi-milation (Section 6.2 et Section 6.3) avec la m´ethode aux hypoth`eses Gaussiennes qu’est l’ETKF puis avec le MRHF, m´ethode non-Gaussienne.

Un filtre Gaussien produit de bons r´esultats dans le cadre quasi-Gaussien de contrˆole de la dynamique par des observations dynamiques. Il apparait dans la Section 6.2, que l’ETKF produit sur les variables dynamiques une analyse performante, avec de faibles RMSE, et un ensemble de dispersion correcte, avec des histogrammes de rangs nettement am´elior´es. Par contre, ces corrections n’ont que des cons´equences (via la physique du mod`ele) tr`es limit´ees sur les variables biog´eochimiques. D’un point de vue physique, ceci nous indique ´egalement, l’impor-tance du contrˆole d’au moins une variable biog´eochimique pour propager l’informa-tion apport´ee par les observal’informa-tions dynamiques `a la partie biog´eochimique du mod`ele. L’utilisation d’un filtre non-Gaussien est plus adapt´ee dans le cadre non-Gaussien de contrˆole de la biog´eochimie par des observations dyna-miques. La Section 6.3, s’attache `a comparer les performances de l’ETKF et du

MRHF, dans le contexte du contrˆole des variables phytoplanctoniques (en plus de T et S) pour les donn´ees de SST `a 6h. Il est important de noter que les profils de temp´erature et de salinit´e (`a 2 jours) sont syst´ematiquement assimil´ees par l’ETKF (pour des raisons de temps de calcul) et que cette configuration ETKF-MRHF est permise par la flexibilit´e d’impl´ementation du MRHF avanc´e au Chapitre 4. Dans ce nouveau cadre les hypoth`eses Gaussiennes de l’ETKF, ne lui permettent pas de correctement contrˆoler le phytoplancton et donc de r´eduire les erreurs d’analyse sur les variables biog´eochimiques. Le choix d’une m´ethode non-Gaussienne, se montre b´en´efique puisque l’analyse fournie par le MRHF r´eussit `a repr´esenter correctement les variables biog´eochimiques (faibles erreurs RMS du phytoplancton total et du ni-trate), de plus, l’ensemble produit pr´esente une fiabilit´e et une r´esolution correctes.

Un r´eseau d’observations fin d´egrade l’ensemble produit par un filtre non-Gaussien. Les r´esultats produits dans la Section 6.4 relativisent les bonnes performances d’un filtre Gaussien, en montrant que le choix d’une m´ethode non-Gaussienne ne doit pas seulement se faire sur le degr´e de non-Gaussianit´e du mod`ele. Bien que la repr´esentation des variables biog´eochimiques faite par l’estim´e moyen du MRHF reste meilleure que celle de l’estim´e moyen de l’ETKF, il est montr´e dans cette section qu’un r´eseau d’observation trop serr´e d´egrade nettement les r´esultats du MRHF en allant jusqu’`a provoquer l’effondrement de l’ensemble. Cette d´egradation se produit ´egalement pour l’ETKF mais `a un degr´e moindre. En effet, les m´ethodes non-Gaussiennes sont connues pour ˆetre plus demandeuses en nombre de membres d’ensemble et l’utilisation d’un r´eseau d’observation fin contraint trop rapidement la dispersion de l’ensemble qui ne parcourt plus qu’une partie trop r´eduite de l’es-pace des solutions. Ce probl`eme doit ˆetre trait´e sur deux fronts : en appliquant des techniques simplifiant le probl`eme (augmenter le nombre de membres, ajouter de l’in-flation, appliquer une localisation ...) ; en poursuivant le d´eveloppement du MRHF, encore jeune.

Chapitre 7

Assimilation de la donn´ee de

cou-leur de l’eau

Sommaire

7.1 Caract´erisation du probl`eme d’assimilation de couleur de l’eau 187

7.1.1 La couleur de l’eau dans ModECOGeL . . . 187

7.1.2 Etude des relations statistiques . . . 188´

La non-Gaussianit´e du phytoplancton de surface . . . 188

Les non-lin´earit´es inter-variables . . . 189

7.1.3 Bilan . . . 192

7.1.4 Zone d’int´erˆet . . . 192

7.2 Contrˆoler le phytoplancton par assimilation de couleur de l’eau 193 7.2.1 Correction de la biog´eochimie par l’ETKF . . . 194

Le phytoplancton total . . . 194

Le nitrate . . . 198

7.2.2 Peu d’impact sur la dynamique . . . 200

7.2.3 Bilan . . . 200

7.3 Contrˆoler la temp´erature par assimilation de couleur de l’eau 202 7.3.1 Pourquoi contrˆoler la temp´erature avec la couleur de l’eau ? . . . . 202

7.3.2 Echec de l’ETKF . . . 203´

7.3.3 Apport de l’assimilation de donn´ees non-Gaussienne . . . 204

RMSE moyenne des diff´erentes m´ethodes . . . 205

Dispersion, fiabilit´e et r´esolution . . . 207

7.3.4 Bilan . . . 209

7.4 Vers un satellite g´eostationnaire . . . 210

7.4.1 Couleur de l’eau haute-fr´equence . . . 211

7.4.2 Bilan . . . 215

7.5 Conclusions . . . 215

Le cadre des exp´eriences pr´esent´ees dans ce chapitre est d´ecrit au Chapitre 5 et est similaire `a celui des exp´eriences du chapitre pr´ec´edent (Chap. 6).

Nous travaillons avec le mod`ele coupl´e de dynamique et de biog´eochimie marine, ModECOGeL, sur le mois d’avril 2006. La v´erit´e est une simulation effectu´ee avec un for¸cage de vent r´eel en haute fr´equence (1 heure). Un ensemble de 50 membres est propag´e par le mod`ele avec un for¸cage de vent haute fr´equence simul´e par un processus auto-regressif Gaussien d’ordre un.

L’objectif premier de ce chapitre est d’´evaluer ce que l’assimilation de donn´ees non-Gaussiennes peut apporter au probl`eme complexe d’assimilation de la couleur de l’eau.

Pour ce faire, nous nous munissons, dans un premier temps, d’un jeu d’observations de la couleur de l’eau avec une fr´equence temporelle de trois jours. Nous ´etudions les performances d’un filtre de Kalman d’ensemble, l’ETKF, assimilant ce jeu d’ob-servations pour le contrˆole du phytoplancton. Puis nous comparons trois filtres : l’ETKF, l’EnKF anamorphos´e et le MRHF assimilant ce mˆeme jeu d’observations pour le contrˆole du phytoplancton et de la temp´erature. Dans un second temps, nous regardons le comportement de ces trois mˆemes m´ethodes face `a une fr´equence d’ob-servations plus grande (fr´equence temporelle d’un jour). Cette derni`ere ´etude se place dans le contexte d’observations issues d’un satellite g´eostationnaire de la couleur de l’eau.

Le tableau de la Figure 7.1 r´ecapitule les diff´erentes exp´eriences mises en place dans les sections 7.2, 7.3 et 7.4.

Dans les travaux r´ealis´es ici, nous cherchons `a contrˆoler uniquement les variables d’´etats. Il est `a noter que le contrˆole des variables d’´etat n’est pas le seul moyen d’am´eliorer l’estimation de la dynamique. La source d’incertitudes impactant la dy-namique du mod`ele ´etant l’intensit´e du vent, il est ´egalement possible de vouloir contrˆoler directement cette source. Par exemple, les travaux de Gregorio et al. (prep), dans une configuration similaire `a celle-ci, contrˆole par assimilation de donn´ees les coefficients du for¸cage stochastique. Nous n’´etudions pas ce probl`eme d’assimilation dans cette th`ese.

Dans la premi`ere section de ce chapitre (Sec. 7.1), nous caract´erisons le probl`eme en d´ecrivant la nature de l’observation de la couleur de l’eau puis en ´etudiant les relations statistiques des variables du probl`eme. Dans la Section 7.2, nous pr´esentons les r´esultats de la premi`ere exp´erience de contrˆole du phytoplancton par l’ETKF. Dans la Section 7.3, nous comparons l’ETKF, l’EnKF anamorphos´e et le MRHF dans le contrˆole du phytoplancton et de la temp´erature. Enfin, la derni`ere section (Sec. 7.4), ouvre la perspective d’une assimilation de la couleur de l’eau haute fr´equence.

7.1. Caract´erisation du probl`eme d’assimilation de couleur de l’eau 187

Figure 7.1 – R´ecapitulatif des diff´erentes exp´eriences d’assimilation selon leurs r´eseaux d’obser-vations de la couleur de l’eau, leurs vecteurs de contrˆole, les m´ethodes ´etudi´ees et les diagnostics utilis´es.

7.1 Caract´erisation du probl`eme d’assimilation de couleur

de l’eau

Dans cette premi`ere section, nous essayons de mieux comprendre l’observation de la couleur de l’eau dans notre ´etude ModECOGeL ainsi que les challenges que ce type d’observation peut apporter `a l’assimilation de donn´ees. Dans la premi`ere sous partie, nous d´ecrivons la couleur de l’eau telle que nous la simulons dans nos exp´eriences avec le mod`ele ModECOGel. Dans la seconde sous partie, nous essayons de caract´eriser le probl`eme de l’assimilation de couleur de l’eau en terme de non-Gaussianit´e et de non-lin´earit´e et ce `a l’aide d’outils statistiques. Les objectifs de cette caract´erisation sont de pouvoir anticiper et de mieux comprendre le comportement des diff´erentes m´ethodes d’assimilation qui seront mises en place par la suite pour r´esoudre ce probl`eme d’assimilation.