• Aucun résultat trouvé

5.5 Bilan

6.1.1 Etude statistique des relations dynamico-biog´eochimiques

L’´etude statistique que l’on effectue dans cette sous partie se d´eroule sur le mois d’avril 2006 consid´er´e pour nos exp´eriences et se focalise sur les premiers 100m de la colonne d’eau o`u les effets qui nous int´eressent prennent place. On d´ecrit puis on utilise une partie des diagnostics sommairement pr´esent´es dans la Section 2.1.1. Ces diagnostics sont appliqu´es `a un ensemble de 50 simulations libres g´en´er´ees par

6.1. ´Etude des relations dynamico-biog´eochimiques 147

perturbation de l’intensit´e du vent comme il est d´ecrit au chapitre pr´ec´edent.

Non-lin´earit´es inter-variables

La premi`ere quantit´e statistique que l’on peut regarder ici est la lin´earit´e au sens de Pearson (Pearson, 1895) entre deux variables r (Sec. 2.1.1). Puisque l’on souhaite savoir si une corr´elation existe entre les variables ´evalu´ees nous pouvons prendre la valeur absolue du coefficient de corr´elation de Pearson qui va donc de 0 `a 1 pour respectivement aucune corr´elation et une corr´elation ou anti-corr´elation totale. La seconde quantit´e statistique que l’on regarde est la lin´earit´e au sens de Spearman ρ(Sec. 2.1.1). En valeur absolue, ce coefficient vaudra 1 pour une forte corr´elation de rang et 0 pour aucune corr´elation de rang. Ces diagnostics nous apportent deux informations diff´erentes :

– La premi`ere est la nature des correlations entre deux variables qui va nous per-mettre de pr´evoir le contrˆole d’une variable par l’observation d’une autre. Dans ce cas l`a, il est `a noter que pour un coefficient de Pearson (en valeur abso-lue) proche de 1, on peut s’attendre `a de bonnes performances de la part des m´ethodes d’assimilation utilisant une r´egression lin´eaire pour propager les cor-rections des variables observ´ees aux variables non observ´ees (e.g. EnKF, ETKF et RHF). Par contre pour un coefficient de Pearson faible et un coefficient de Spearman proche de 1, l’anamorphose telle que d´ecrite au chapitre 1 (Section 2.3.2) doit correctement propager les corrections `a toutes les variables. L’ana-morphose est une transformation adapt´ee aux faibles non-Gaussianit´es. Dans le cas des coefficients de Pearson et Spearman tous deux proches de 0, seule une m´ethode d’assimilation fondamentalement non-Gaussienne pourrait appliquer des corrections adapt´ees s’il existe des relations statistiques autres que lin´eaires. – La seconde peut donner une indication sur le ph´enom`ene dominant dans un processus. Une corr´elation forte entre deux variables peut signifier que l’une des deux variables joue un rˆole important dans l’´evolution de l’autre. Ce qui permet de confirmer l’origine des variations et le degr´e de non-lin´earit´e qui les caract´erise.

La Figure 6.1 repr´esente en fonction de la profondeur (en m`etres sur les 100 pre-miers m`etres de la colonne d’eau) et du temps (en jours sur le mois), le coefficient rX,Y (colonne de gauche), le coefficient ρX,Y (colonne du centre) et le ratio des deux

rX,Y

ρX,Y (colonne de droite) pour les variables X, Y = T KE, T EM (premi`ere ligne), X, Y = T EM, N O3 (deuxi`eme ligne), X, Y = N O3, P hyto (troisi`eme ligne) et X, Y = T EM, P hyto (quatri`eme ligne). La premi`ere remarque au vu des graphiques de la Fig. 6.1, est que les coefficients de Pearson et Spearman sont tr`es proches.

Une information qu’apportent la deuxi`eme et la quatri`eme ligne de la Fig. 6.1 est que la relation entre la temp´erature et la biog´eochimie est tr`es non-lin´eaire (au sens

de Pearson). Il sera donc difficile de contrˆoler la biog´eochimie (e.g. le phytoplancton) avec un filtre de type ETKF ou RHF en observant la temp´erature. De plus, pour la relation temp´erature-phytoplancton, le ratio des deux coefficients (colonne de droite) est souvent proche de 1, ce qui confirme la proximit´e des deux coefficients. Ceci nous indique d´ej`a que lorsqu’il y a une relation statistique entre ces deux variables il s’agit d’une lin´earit´e au sens de Pearson. Il n’y a donc que peu de cas pour lesquels on retrouve une lin´earit´e uniquement de rangs. Ainsi on peut d´ej`a savoir a priori que l’anamorphose apportera peu d’am´elioration au filtre de Kalman d’ensemble.

6.1. ´Etude des relations dynamico-biog´eochimiques 149

Figure 6.1 – Graphiques temps/profondeur de la valeur absolue du coefficient rX,Y (colonne de gauche), du coefficient ρX,Y (colonne du centre) et du ratio des deux rX,Y

ρX,Y (colonne de droite) pour les variables X, Y = T KE, T EM (premi`ere ligne), X, Y = T EM, N O3 (deuxi`eme ligne), X, Y = N O3, P hyto (troisi`eme ligne) et X, Y = T EM, P hyto (quatri`eme ligne).

La relation entre TKE et la temp´erature, nous indique le rˆole dominant de l’incur-sion d’´energie cin´etique `a partir du 10`eme jour sur la dispersion de temp´erature entre 20m et 80m. Ceci confirme le raisonnement apport´e `a la sous partie pr´ec´edente. Les variations de temp´erature d´ependent donc principalement et de mani`ere non-lin´eaire des variations de TKE. Une autre information qui ressort de ces graphiques est l’importante non-lin´earit´e que traverse la propagation des incertitudes (telle que d´ecrite qualitativement `a la section pr´ec´edente) depuis le vent impactant directement TKE modifiant la structure verticale de la temp´erature pour finalement influencer la biog´eochimie. `A travers cette succession de relations non-lin´eaires, les perturbations Gaussiennes sur le vent vont progressivement se d´egrader au cours de leur propaga-tion et perdre leur nature Gaussienne.

Ce dernier ph´enom`ene est constat´e dans le paragraphe suivant `a l’aide d’un diag-nostic de normalit´e.

Non-Gaussianit´e des variables

Le coefficient de D’Agostino-Pearson (D’Agostino and Pearson, 1973) combine deux coefficients mesurant l’asym´etrie (skewness) et le kurtosis d’un ´echantillon afin d’´etablir une distance `a la Gaussianit´e. De ce coefficient est cr´ee un test dit test de normalit´e omnibus de D’Agostino-Pearson qui a comme hypoth`ese nulle que l’´echantillon ´evalu´e provient d’une distribution Gaussienne. La p-valeur produite par ce test est une probabilit´e χ2 `a deux cˆot´es pour l’hypoth`ese nulle. Cette hypoth`ese est rejet´ee avec une significativit´e de 95% pour une p-valeur inf´erieure `a 0.05. Plus la p-valeur est proche de 0 plus l’´echantillon diff`ere d’un ´echantillon Gaussien.

La Figure 6.2 montre la p-valeur du test de normalit´e omnibus de D’Agostino-Pearson en fonction de la profondeur (en m`etres sur les 100 premiers m`etres de la colonne d’eau) et du temps (en jours sur le mois), pour TKE (panneau sup´erieur gauche), la temp´erature (panneau sup´erieur droit), le nitrate (panneau inf´erieur gauche) et le phytoplancton (panneau inf´erieur droit). Les p-valeurs sont donn´ees entre 0 et 0.05, les zones en blanc sont donc les zones o`u l’´echantillon peut ˆetre consid´er´e comme provenant d’une distribution Gaussienne.

La variable TKE est tr`es non-Gaussienne sur presque toute la colonne d’eau. Ceci est dˆu `a la faible dispersion d’´energie cin´etique turbulente puisque sans ´ev´enement de fort vent le terme TKE est quasiment nul pour tous les membres. On peut toutefois voir les quelques incursions de TKE en surface et leur distribution Gaussienne, sous l’effet du vent (avec un ´ev´enement fort vers le 10`eme jour). Bien que la temp´erature soit tr`es Gaussienne dans les 10 premiers jours on constate que la non-Gaussianit´e se propage avec l’approfondissement des couches de temp´erature de surface entre 40m et 90m dans les 20 derniers jours du mois. Ce pattern (motif) correspond au pattern de forte correlation, entre TKE et la temp´erature, observ´ee sur le graphique

6.1. ´Etude des relations dynamico-biog´eochimiques 151

Figure 6.2 – Graphique temps/profondeur de la p-valeur du test de normalit´e de D’Agostino-Pearson pour les variables TKE (panneau sup´erieur gauche), T (panneau sup´erieur droit), NO3 (panneau inf´erieur gauche) et le total de phytoplancton (panneau inf´erieur droit).

de la Figure 6.1 (premi`ere ligne, premi`ere colonne). Ceci est en accord avec le rai-sonnement de la sous partie pr´ec´edente sur la g´en´eration de non-Gaussianit´e par l’incursion de diff´erentes intensit´es du m´elange TKE en profondeur. Les variables biog´eochimiques (le nitrate et le phytoplancton) pr´esentent des caract`eres que l’on peut alternativement consid´erer comme Gaussiens ou tr`es non-Gaussiens r´epartis de mani`ere h´et´erog`ene sur la verticale et dans le temps. Cette r´epartition s’explique par la succession de ph´enom`enes dominants d´ecrits dans la section pr´ec´edente. Il ressort ´egalement de la Figure 6.2 que l’utilisation d’une m´ethode d’assimilation Gaussienne pourra suffire `a contrˆoler la temp´erature dans une grande partie du domaine. Le

contrˆole du phytoplancton est plus difficile avec des distributions alternativement Gaussienne et tr`es non-Gaussienne.

6.1.2 Bilan

La complexit´e anticip´ee des relations entre les variables a ´et´e confirm´ee par l’´etude des lin´earit´es inter-variables qui rentrent en jeu dans notre syst`eme. Ces non-lin´earit´es vont avoir deux impacts sur l’assimilation de donn´ees. Tout d’abord, la relation non-lin´eaire (affine et de rangs) entre les variables peut rendre difficile la pro-pagation des corrections de l’assimilation des variables observ´ees aux variables non observ´ees par des m´ethodes telles que l’EnKF, l’ETKF, le RHF ou encore l’EnKF anamorphos´e. D’autre part, ces non-lin´earit´es vont d´egrader la Gaussianit´e des dis-tributions de probabilit´e du syst`eme. Ce dernier point a ´et´e confirm´e par l’´etude de normalit´e de l’ensemble. Ceci mettra en d´efaut l’hypoth`ese de Gaussianit´e ´emise par les m´ethodes d’assimilation aux moindres carr´es.

Il ressort de cette ´etude que le contrˆole de la temp´erature et de la salinit´e en observant la temp´erature et la salinit´e s’apparente `a un probl`eme peu non-lin´eaire et quasi-Gaussien. Alors que le contrˆole de la biog´eochimie (e.g. le phytoplancton) s’av`ere plus compliqu´e et peut ˆetre qualifi´e de probl`eme fortement non-Gaussien.

6.2 Contrˆoler la dynamique, un probl`eme quasi-Gaussien

Pour cette premi`ere exp´erience d’assimilation de donn´ees avec le mod`ele ModECO-GeL nous nous pla¸cons dans le cadre d´ecrit au chapitre pr´ec´edent. Nous souhaitons contrˆoler sur le mois d’avril 2006, la temp´erature (T) et la salinit´e (S) `a partir de profils de (T,S) et d’observations satellites de (T). Les profils sont disponibles tous les deux jours et la fr´equence des observations satellites varie de 6h, 3h, 1h `a 30min (voir le Tableau 5.1 pour la nomenclature des configurations).

Il a ´et´e constat´e dans la section pr´ec´edente qu’un tel probl`eme s’apparentait `a un prob`eme peu lin´eaire et quasi-Gaussien. Ainsi, dans cette section, nous utilisons le filtre de Kalman d’ensemble transform´e (ETKF) en s’attendant `a de bonnes perfor-mances.

Apr`es avoir r´ealis´e de nombreuses assimilations, nous observons `a l’aide de plu-sieurs diagnostics le comportement de l’ETKF dans ce contexte et en fonction de la fr´equence d’observations satellites.

Dans une premi`ere sous partie, nous ´evaluons l’impact de l’assimilation sur la partie dynamique du syst`eme (temp´erature et salinit´e). Comme le sugg`ere la Section 2.3.1 sur l’´evaluation d’une assimilation d’ensemble, nous ´evaluons non seulement l’estim´e moyen (l’analyse) mais aussi la qualit´e de l’ensemble g´en´er´e par l’ETKF. Dans une deuxi`eme sous partie, nous regardons l’impact qu’une correction des variables