• Aucun résultat trouvé

3.3 Illustration des m´ethodes

3.3.2 Illustration

Dans cette illustration, nous regardons les m´ethodes pr´esent´ees en Section 3.2. Chaque m´ethode est test´ee avec une taille d’ensemble pour laquelle elle est la plus performante. L’objectif n’est donc pas de comparer les m´ethodes entre elles mais de voir si les m´ethodes fonctionnent bien. On per¸coit ´egalement une premi`ere id´ee des comportements des m´ethodes notamment dans l’augmentation des non-lin´earit´es d’une configuration `a l’autre.

Les filtres de Kalman d’ensemble

Les filtres de Kalman d’ensemble sont connus pour leurs bonnes performances dans un cadre quasi-lin´eaire et peu non-Gaussien. Ces performances sont confirm´ees sur cette illustration.

Le filtre de Kalman d’ensemble stochastique (EnKFs) est pr´esent´e en Figure 3.3 (gra-phiques de gauche, courbes rouges). Il est ´evalu´e avec un ensemble de 30 membres. Le filtre de Kalman transform´e (ETKF) est pr´esent´e en Figure 3.3 (graphiques de droite, courbes bleues). Il est ´evalu´e avec un ensemble de 10 membres pour les cas ∆t = 0.10 et 0.25, et avec 30 membres pour le cas ∆t = 0.50. La v´erit´e est repr´esent´ee par la courbe verte.

Il est `a noter que l’ETKF r´esoud le probl`eme d’estimation dans l’espace de l’ensemble. Or comme le degr´e de libert´e associ´e `a ce probl`eme est petit (3 degr´es de libert´e), la taille de l’ensemble n’a pas besoin d’ˆetre grande. Nous avons mˆeme constat´e que l’utilisation de l’ETKF avec un ensemble de grande taille d´egrade la solution (pas montr´e ici). Dans ces conditions, les r´esultats produits par ces deux filtres sont tr`es proches. Ceci etait attendu puisque comme nous l’avons vu ces filtres sont deux versions d’un mˆeme filtre avec les mˆemes hypoth`eses.

Dans le cas `a faible non-lin´earit´e (∆t = 0.10, graphiques sup´erieurs), l’EnKFs et l’ETKF produisent des ensembles dont la moyenne est tr`es proche de la v´erit´e (courbe verte). Mˆeme si nous ne regardons pas, ici, de scores de dispersion ou de r´esolution, l’enveloppe des ensembles semble bien capturer la v´erit´e.

Plus la fr´equence d’observations diminue plus les solutions se d´egradent. Les ensembles produits par l’EnKFs et l’ETKF dans le cas `a moyenne non-lin´earit´e (∆t = 0.25, gra-phiques centraux) sont plus dispers´es que dans le cas pr´ec´edent. Cependant, l’enveloppe des ensembles continue d’inclure la v´erit´e.

En diminuant encore la fr´equence d’observations, i.e. dans le cas fortement non-lin´eaire (∆t = 0.50, graphiques inf´erieurs), les ensembles divergent par moment de la v´erit´e. `A partir du pas de temps 5700 et jusqu’`a la fin de la fenˆetre, les deux ensembles d´ecrochent progressivement.

Le RHF et l’EnKF anamorphos´e

Le filtre d’histogrammes de rangs (RHF) et le filtre de Kalman d’ensemble anamorphos´e (EnKF anamorphos´e) sont des filtres bas´es sur le cadre aux hypoth`eses lin´eaires et Gaus-siennes de Kalman en prenant en compte de diverses mani`eres les non-Gaussianit´es (voir Sec. 3.2). `A cet ´egard, ils produisent des r´esultats proches ou moins bons que les filtres de Kalman dans un cadre quasi-lin´eaire et peu non-Gaussien. De plus, ces filtres n´ecessitent des ensembles de plus grandes tailles. Par contre, de meilleures performances sont `a at-tendre dans un cadre plus non-lin´eaire. Cette illustration nous confirme ces attentes pour le RHF et nous alerte sur les limitations de l’anamorphose.

3.3. Illustration des m´ethodes 69

Figure 3.3 – S´eries temporelles des ensembles produits par l’EnKFs (graphiques de gauche, courbes rouges) et l’ETKF (graphiques de droite, courbes bleues) des pas de temps 5000 `a 6000, dans les configurations ∆t = 0.10 (graphiques sup´erieurs), ∆t = 0.25 (graphiques centraux) et ∆t = 0.50 (graphiques inf´erieurs). La v´erit´e est repr´esent´ee par la courbe verte.

Le RHF est pr´esent´e en Figure 3.4 (graphiques de gauche, courbes magentas). Il est ´evalu´e avec un ensemble de 50 membres. L’EnKF anamorphos´e est pr´esent´e en Figure 3.4

(graphiques de droite, courbes grises). Il est ´evalu´e avec un ensemble de 50 membres. La v´erit´e est repr´esent´ee par la courbe verte.

Il est apparu que l’anamorphose de l’observation, dans notre impl´ementation, ne fonc-tionne pas lorsque l’ensemble a priori et l’observation sont trop ´eloign´es (probl`eme de biais). Ce probl`eme se produit dans les trois configurations. Il a donc fallu introduire une inflation de l’ensemble dans la premi`ere configuration (∆t = 0.10) d’un coefficient (opti-mis´e) 1.04. Dans les trois configurations, nous avons introduit une inflation de la matrice de covariances d’erreurs d’observations Ro = diag(4, 4, 4). Les coefficients (optimis´es) de cette derni`ere inflation sont 3, 2.8 et 1.79 pour, respectivement, les configurations ∆t = 0.10, 0.25 et 0.50. Nous pr´esentons les r´esultats obtenus pour l’EnKF anamorphos´e avec inflation malgr´e le fait qu’ils ne soient pas repr´esentatifs des r´esultats potentiels de cette m´ethode dans des cas sans ces forts biais. L’apparition de cette difficult´e pour l’EnKF anamorphos´e, qui a par ailleurs montr´e ses bonnes performances (Bertino et al., 2003; B´eal et al., 2010), confirme l’id´ee qu’aucune m´ethode n’est id´eale pour tous les probl`emes d’estimation.

Dans le cas faiblement et moyennement non-lin´eaire (∆t = 0.10 et ∆t = 0.25), le RHF se comporte de mani`ere identique aux filtres de Kalman d’ensemble avec un estim´e moyen tr`es proche de la v´erit´e et un ensemble tr`es peu dispers´e. Le RHF semble produire un ensemble mieux dispers´e que les filtres de Kalman d’ensemble, dans le cas fortement non-lin´eaire (∆t = 0.50). En particulier, autour du pas de temps 5700, les membres de l’ensemble produits par le RHF ne divergent pas hors du voisinage de la v´erit´e.

Les r´esultats produits par l’EnKF anamorphos´e sont plus difficiles `a lire. En particulier, dans le cas tr`es contrˆol´e de la configuration faiblement non-lin´eaire, l’inflation d’ensemble disperse ´enorm´ement l’ensemble. L’ensemble est, tout de mˆeme, corrig´e vers la v´erit´e tous les 10 pas de temps. Dans les configurations moyennement et fortement non-lin´eaire, les ensembles produits par l’EnKF anamorphos´e sont mieux dispers´es et estiment globalement bien la v´erit´e. Dans la configuration moyennement non-lin´eaire, avant le pas de temps 5200 et apr`es le pas de temps 5700, l’EnKF anamorphos´e ne contrˆole pas bien la dispersion de l’ensemble.

Le PF-bootstrap

Le filtre particulaire bootstrap (PF-bootstrap) est con¸cu pour pouvoir g´erer de fortes non-lin´earit´es et de fortes non-Gaussianit´es. Comme il a ´et´e mentionn´e pr´ec´edemment, le PF-bootstrap est victime de la mal´ediction de la dimensionnalit´e. Dans une application comme le Lorenz 63, la dimension est faible. Pourtant les bonnes performances du PF-bootstrap n´ecessitent un nombre de membres bien plus grand que les filtres de Kalman d’ensemble.

Le PF-bootstrap est pr´esent´e en Figure 3.5 (courbes noires). Il est ´evalu´e avec un ensemble de 100 membres. La v´erit´e est repr´esent´ee par la courbe verte.

3.3. Illustration des m´ethodes 71

Figure 3.4 – Idem de la Figure 3.3 pour les ensembles produits par le RHF (graphiques de gauche, courbes magentas) et l’EnKF anamorphos´e (graphiques de droite, courbes grises).

dans le cas faiblement non-lin´eaire (∆t = 0.10). L’ensemble semble toutefois bien couvrir la v´erit´e. La qualit´e du PF-bootstrap se voit principalement sur les deux configurations plus non-lin´eaire (∆t = 0.25 et 0.50). En effet, les ensembles produits sont corrig´es avec pr´ecision `a chaque observation. De plus, le principe de re-´echantillonnage du PF-bootstrap

Figure 3.5 – Idem de la Figure 3.3 pour les ensembles produits par le PF-bootstrap (courbes noires).

produit chaque membre comme un ´etat du mod`ele (sans compter l’ajoˆut de bruit). Ceci a pour effet de maintenir l’ensemble dans un ´equilibre au sein de l’attracteur du mod`ele et donc de stabiliser la trajectoire de chaque membre.

3.3. Illustration des m´ethodes 73 Les Root Mean Square Errors

Pour avoir une vision plus globale de la qualit´e des estim´es moyens produits par les diff´erentes m´ethodes, nous regardons `a pr´esent les erreurs RMS (Root Mean Square Er-rors). Ces RMSE sont calcul´ees sur les trois variables (x, y, z) et sur la p´eriode temporelle enti`ere (i.e. du pas de temps 5000 au pas de temps 10000). Elles sont calcul´ees pour les trois configurations et pour cinq m´ethodes d’assimilation. Les scores RMSE sont pr´esent´es dans la Figure 3.6 en fonction des configurations ∆t = 0.10, 0.25 et 0.50 pour l’EnKF (carr´es bleus fonc´es), l’ETKF (triangles vers le haut verts), l’EnKF anamorphos´e (dia-mants rouges), le RHF (triangles vers le bas cyans) et le PF (croix magentas).

Figure 3.6 – Scores RMSE des estim´es moyens produits par l’EnKF (carr´es bleus fonc´es), l’ETKF (triangles vers le haut verts), l’EnKF anamorphos´e (diamants rouges), le RHF (triangles vers le bas turquoises) et le PF (croix magentas) ; en fonction des configurations ∆t = 0.10, 0.25 et 0.50. Les RMSE sont calcul´ees pour les trois configurations et pour cinq m´ethodes d’assimilation.

Les deux filtres de Kalman d’ensemble (EnKFs et ETKF), le RHF et le PF-bootstrap pr´esentent des erreurs RMS tr`es proches dans les configurations aux faibles lin´earit´es (cas ∆t = 0.10). La qualit´e des estim´es moyens produits par l’EnKFs, l’ETKF et le RHF se d´egradent (les RMSE augmentent) avec la diminution de la fr´equence d’observation. Il

est toutefois `a noter que dans la configuration aux fortes non-lin´earit´es (cas ∆t = 0.50) le RHF a une RMSE plus faible, ce qui t´emoigne de sa capacit´e `a mieux g´erer les non-lin´earit´es et les non-Gaussianit´es. De mani`ere plus prononc´ee, le filtre particulaire bootstrap pr´esente des erreurs RMS tr`es faibles dans les cas de plus en plus non-lin´eaires. Le PF-bootstrap est donc tr`es adapt´e aux fortes non-lin´earit´es et non-Gaussianit´es lorsqu’il est pouvu d’un nombre de membres suffisant. Enfin, le cas de l’EnKF anamorphos´e est plus d´elicat. La pr´esence de biais entre l’ensemble a priori et l’observation ne permet pas de correctement anamorphoser les covariances d’erreurs d’observations. Ce probl`eme se traduit par un effondrement de l’ensemble qui oblige `a imposer de fortes inflations (sur l’ensemble et/ou sur les covariances d’erreurs d’observations). Dans ce contexte, les scores RMSE de l’ETKF anamorphos´e sont tous moins bons que les autres m´ethodes pr´esent´ees. Lors de la mise en place de l’ETKF anamorphos´e, il est donc important de faire attention au bon recouvrement des observations par l’ensemble.

3.4 Conclusions

Dans ce chapitre, une description algorithmique des m´ethodes d’assimilation employ´ees dans la suite de cette th`ese a ´et´e propos´ee. Cette description fournit les outils n´ecessaires `

a la reproduction des r´esultats de la th`ese. Elle permet ´egalement d’apercevoir le travail d’impl´ementation structur´ee qui a ´et´e mis en place. Nous nous sommes donc munis d’une plateforme python comprenant :

– un filtre de Kalman d’ensemble stochastique (EnKFs), – un filtre de Kalman d’ensemble transform´e (ETKF),

– un filtre de Kalman d’ensemble anamorphos´e (Anam-EnKF), – un filtre d’histogrammes de rangs (RHF),

– un filtre particulaire bootstrap (PF-Bootstrap),

Cette plateforme nous permet d’appliquer de mani`ere automatique ces m´ethodes sur n’im-porte quel probl`eme d’assimilation. C’est ce qui sera fait par la suite, pour des probl`emes d’estimation en biog´eochimie marine.

On peut discriminer ces cinq m´ethodes en trois approches pour g´erer la non-Gaussianit´e. La premi`ere cat´egorie comprend les m´ethodes moindres carr´es (donc aux hypoth`eses Gaus-siennes) : EnKFs et ETKF. La deuxi`eme cat´egorie comprend les m´ethodes adaptant les moindres carr´es aux cas non-Gaussiens : Anam-EnKF et RHF. La troisi`eme cat´egorie com-prend les m´ethodes ne faisant aucune hypoth`ese de Gaussianit´e : PF-Bootstrap.

Afin, d’illustrer l’application de ces m´ethodes, la deuxi`eme partie de ce chapitre pr´esente des exp´eriences d’assimilation de donn´ees sur un mod`ele de petite dimension. Le mod`ele employ´e est le mod`ele de Lorenz `a trois variables, Lorenz 63. Ce mod`ele a ´et´e couram-ment utilis´e comme cas-test de r´ef´erence dans la litt´erature. Il pr´esente un comportecouram-ment

3.4. Conclusions 75 typiquement chaotique et ses diff´erentes configurations fournissent des probl`emes d’estima-tion aux non-lin´earit´es et non-Gaussianit´es variables. Cette illustrad’estima-tion nous a permis de constater les bonnes performances des filtres de type Kalman dans les configurations dites quasi-lin´eaires et peu non-Gaussiennes. De plus, le filtre particulaire confirme ses aptitudes `

a g´erer les probl`emes tr`es non-Gaussiens pour un nombre de membres suffisant (ici, 100 membres). Le RHF se comporte comme les filtres aux hypoth`eses Gaussiennes (EnKFs et ETKF) dans les configurations aux non-lin´earit´es faibles et moyennes. Il produit une erreur RMS l´eg´erement plus faible que ces derni`eres dans la configuration aux fortes non-lin´earit´es en n´ecessitant moins de membres que le filtre particulaire. Enfin, les r´esultats produits par l’EnKF anamorphos´e d´enotent une limitation de notre impl´ementation de ce filtre. Malgr´e les bonnes performances de ce filtre dans d’autres contextes (Bertino et al., 2003; B´eal et al., 2010), ce filtre est soumis `a un effondrement d’ensemble lors de la pr´esence de forts biais entre l’a priori et l’observation.

Cette illustration permet, en outre, de constater la n´ecessit´e d’une nouvelle m´ethode pouvant g´erer de fortes non-Gaussianit´es en se basant sur un nombre de membres plus rai-sonnable que le filtre particulaire. Une telle m´ethode fait partie de la plateforme assimilation impl´ement´ee. Cette m´ethode est le filtre multivari´e d’histogrammes de rangs (MRHF). Ce filtre a ´et´e d´evelopp´e au cours de cette th`ese. Sa mise en place et son ´evaluation sur le mod`ele de Lorenz 63 sont pr´esent´ees dans le chapitre-article (Metref et al., 2014) suivant.

Chapitre 4

D´eveloppement d’un filtre non-Gaussien :

le MRHF

Sommaire

4.1 Introduction . . . . 79