• Aucun résultat trouvé

Dans cette section, je rappelle d’abord le cadre théorique de l’estimateur optimal à partir de l’inversion Bayésienne et introduit les notations. Je présente ensuite trois exemples d’estimateur optimal avec une ou plusieurs contrainte(s), dans le contexte de la fermeture du cycle de l’eau, tous basés sur la théorie Bayésienne.

1.1.a L’inversion Bayésienne

L’inversion Bayésienne consiste à utiliser une observation indirecte y afin d’inférer une certaine information sur l’état d’un système x, connaissant le lien H dex à y.

Considérons le vecteur d’étatx comme une variable aléatoire. Le vecteur observa-tion y est lié àx par la relation suivante :

y = H(x) + ϵ. (V.2)

Le vecteur d’état, noté x, contient l’état du système étudié. L’inversion Bayésienne a généralement pour but d’estimer au mieux ce vecteur. Typiquement, dans le cas du transfert radiatif, x représente les variables atmosphériques à quantifier. Générale-ment, nous disposons d’une estimation du vecteur d’état appeléea prioriet notéexb (b pour "background"). Cette "ébauche" est issue de la connaissances du système avant

l’observation (climatologie, processus d’assimilation antérieur, prévision du modèle,...). Cette connaissance se traduit par la densité de probabilité ("probability density fonc-tion", pdf en anglais)P (x), caractérisé par sa matrice de covariance d’erreurB.

Le vecteur d’observation - noté y, auquel on a accès par la mesure, est une obser-vation indirecte de l’état du système x. La mesure est impactée par un bruitϵ, variable aléatoire indépendante de x souvent considérée comme gaussienne et de matrice de covariance d’erreurQ.P (y)est la pdf a prioride la mesure y. Dans le cas du transfert radiatif, y est la mesure satellite du rayonnement passif émis par l’atmosphère etϵest le bruit instrumental au niveau du capteur.

L’opérateur d’observation, noté H, est un opérateur déterministe non nécessaire-ment linéaire qui relie chaque point de l’espace des états x à un point dans l’espace des mesures y.

Le théorème de Bayes donne un formalisme pour inverser statistiquement l’opé-rateur H et calculer une densité de probabilité a posteriori par mise à jour de la pdf a priori P (x)avec la pdf de mesureP (y):

• Soit P (x) la pdf a priori de x. P (x)d x est alors la probabilité, avant la mesure, que x appartienne au volume (x, x + d x) ; ce qui traduit quantitativement notre connaissance dexavant que la mesure ne soit faite.

• P(y)est la pdfa prioride la mesure y avant que celle-ci soit effectuée.

• P(x, y) est la probabilité jointea priori.P (x, y)d xd y est la probabilité que x soit dans (x,x + d x) et y dans (y, y + d y).

• P(y/x) est la probabilité conditionnelle dey sachantx,P (y/x)d y représente l’in-formation sur y si l’état étaitx. C’est l’équivalent probabiliste du transfert radiatif dans le cas ouy est l’observation satellite.

• P(x/y) est la probabilité conditionnelle dex sachant y. On a alors : P (x) =P (x, y)d y, P (y/x) =P (x, y) P (x) , (V.3) P (x/y) =P (x, y) P (y) .

En éliminant P (x, y) dans la 3e équation, on obtient le théorème de Bayes pour la relation entre les deux pdfs conditionnelles :

P(x/y) = P (y/x)P (x)

P (y) .

P(x/y) est alors la pdfa posterioride x une fois que la mesure est effectuée. Cette information est utilisée ensuite pour mettre à jour la pdf a priori P (x)de x.

On peut alors trouver xa (a pour analyse) tels que la probabilité P (x = xa/y) soit maximale. C’est l’estimateur de Bayésien. Le cas où l’opérateur H est linéaire et où toutes les variables (x,ϵ,y) sont gaussiennes constitue un problème inverse simple où l’estimateur optimal peut être explicité en prenant le logarithme des pdfs.

yi = Hi· x + ϵi, (V.8) où chaqueϵi possède une matrice de covarianceQi indépendantes des autres. Le théorème de bayes donne :

P (x/y1, y2,··· , yl) =P (y1, y2,··· , yl/x)P(x) P (y1, y2,··· , yl) =P (y1/x)P(y2/x)···P(yl/x)P(x) P (y1)P(y2)···P(yl) (V.9) = P(x) ·∏ P (yi/x) P (yi) . L’Eq.(V.5)devient alors :

−2 · ln[P(x/y)] = (y − H1x)tQ1−1(y − H1x) + (y − H2x)tQ2−1(y − H2x) + (x − xb)tB−1(x − xb) + c, (V.10) et La solution : S−1a = +B−1+ H1tQ1−1H1+ H2tQ2−1H2, (V.11) xa= xb+ Sa[Ht 2Q2−1(y2− H2xb) − Ht 1Q−11 (y1− H1xb)].

Bien que l’estimateur Bayésien ait été introduit ici dans le cadre du transfert radiatif pour lequel, l’espace des variables d’état x diffère de l’espace des observations y. On peut élargir le problème d’inverse Bayésien au cas particulier où l’observation y

est le résultat d’une contrainte H sur le vecteur d’état x. Dans ce cas l’opérateur H

est une contrainte considérée comme une "observation" virtuelle dans le contexte de l’inversion Bayésienne (Rodgers, 2000).

1.1.b Un exemple d’estimateur optimal avec une seule contrainte

Dans le cadre du projet NEWS1 qui vise à mieux caractériser le cycle de l’eau à l’aide des produits satellites, Rodell et al. (2015) ainsi que L’Ecuyer et al. (2015) mettent en place une contrainte hydrologique et énergétique afin de fermer simultané-ment les cycles de l’eau et de l’énergie, à l’échelle du globe, aussi bien sur la partie continentale que sur l’océan et dans l’atmosphère. Les deux cycles sont contraints simultanément grâce à l’équivalence entre l’évapotranspiration et la chaleur latente. Afin de prendre en compte ces contraintes, ils utilisent un estimateur linéaire où les erreurs sont considérées comme gaussiennes. Dans la suite je décrirai les méthodes d’intégration appliquées seulement à la contrainte hydrologique continentale.

Dans (Rodell et al., 2015), les composantes du cycle de l’eau se distinguent en :

1. La NASA a lancé en 2003 un programme d’étude sur les cycles de l’énergie et de l’eau (NASA Energy and Water cycle Study, NEWS). Ce programme vise à bénéficier des progrès obtenus dans l’observation satellite. En particulier, NEWS documente les cycles de l’eau et d’énergie globaux en utilisant les produits satellites les plus récents. Le programme s’intéresse aussi aux changements du cycle de l’eau et de ses composantes en réponse au changement climatique. NEWS a ainsi évalué les effets du changement climatique sur la fonte des neiges sous les hautes latitudes et a également permis l’estimation de l’évolution de la répartition de l’eau au sein des composantes continentales du cycle.

• termes de flux x (précipitation, évaporation, évapotranspiration, divergence de l’humidité atmosphérique, ruissellement) ; pour lequel on dispose d’un a priori

(i.e. première estimation) xb donné par les produits satellites avec une incerti-tude caractérisée par la matriceB de covariance d’erreursa priori;

• termes de stock (contenu du sol en eau, contenu des océans en eau, contenu atmosphérique en vapeur d’eau), vue comme une observation y bruitée des flux ;

• H = (1,−1,−1)t représente l’équilibre entre les termes de flux et ceux de stock pour l’équation du bilan hydrique continental (voir la section 1.4, pour une dis-cussion sur les hypothèses de Rodell et al. (2015)) etϵl’erreur dans les stocks qui déséquilibrent le bilan hydrique (ϵ est supposé gaussien) caractérisée par sa matrice de covariance d’erreurR.

On peut écrire l’équation du cycle de l’eau comme un problème inverse dans le cadre du Théorème de Bayes :

y = H · x + ϵ. (V.12)

En considérant les observations de flux comme a priori sur le vecteur d’état des flux et les produits satellites des stocks comme une observation bruitée des flux, avec l’opérateur d’observation H = (1,−1,−1)t, Rodell et al. (2015) trouvent une estimation des fluxxa pour laquelle la contrainte de fermeture est respectée suivant l’Eq.(V.7).

1.1.c Un exemple d’estimateur optimal avec plusieurs contraintes

Dans le cadre du projet ESA WATCHFUL sur la fermeture du cycle de l’eau, Aires (2014) a développé plusieurs méthodologies (voir la Table V.1) pour intégrer de nom-breux produits satellites avec une contrainte de fermeture du bilan hydrique. Ces mé-thodes consistent à partitionner les résidus du bilan, c’est-à-dire le déséquilibre de l’Eq.(III.1), entre les composantes en fonction de leur incertitude.

Soit x = (P,E,∆S,R)t la variable d’état des quatre composantes du cycle de l’eau continental. La fermeture du bilan hydrique peut être considérée comme l’observation de l’équilibre et s’écrit :

y1= 0 = H1· x + ϵ1, (V.13)

avec H1 = (1,−1,−1,−1). On a alors ϵ1 qui représente la non fermeture du cycle de l’eau (voir l’Eq. (V.1), première ligne) et peut être caractérisée par sa matrice de covarianceQ1.

Cette approche peut être étendue à plusieurs produits satellites disponibles pour chacune des composantes du cycle de l’eau. Soit le vecteur rassemblant tous les pro-duits satellites pour chacune des composantes :

y2= (P1,...,Pp, E1,...,Eq, R1,...,Rr,∆S1,...,∆Ss)t. (V.14) En considérant les différents produits satellites et leur incertitude, on a l’équation d’observation suivante :

y2= H2· x + ϵ2, (V.15)

x est toujours le vecteur d’état des quatre composantes du cycle de l’eau et y2 repré-sente les produits satellites estimant chacune de ces composantes. Les produits sa-tellites possèdent une incertitude ϵ2 à cause du bruit instrumental mais aussi à cause des différents algorithmes d’inversion et de leurs hypothèses. Cette incertitude est ca-ractérisée par la matrice de covariance de bruitQ2. H2est l’opérateur d’observation et a la structure suivante2 H2=                                1 0 0 0 · · · · · · · · 1 0 0 0 0 1 0 0 · · · · · · · · 0 1 0 0 0 0 1 0 · · · · · · · · 0 0 1 0 0 0 0 1 · · · · · · · · 0 0 0 1                               

Le but de cette approche est d’exploiter simultanément toutes les informations dis-ponibles et de trouver le meilleur compromis pour estimer xavec les deux contraintes et una priori.

On peut alors considérer le problème dans le cadre de l’estimateur optimal avec plusieurs observations/contraintes indépendantes. On dispose :

• d’una priori xb donné par la climatologie avec une incertitude caractérisée par la matriceB de covariance d’erreursa priori.

• d’une contrainte hydrologiquey1bruitée de covariance d’erreurQ1représentant la contrainte hydrologique

• d’une observationy2caractérisée par sa matrice de covariance d’erreurQ2. D’après le théorème de Bayes étendu au cas gaussien linéaire avec plusieurs ob-servations indépendantes (Eq. (V.10)), la solution à ce problème existe où y1= 0 dans Eq.(V.11):

S−1a = +B−1+ H1tQ1−1H1+ H2tQ−12 H2, (V.16)

xa= xb+ Sa[Ht

2Q−12 (y2− H2xb) − Ht

1Q1−1(H1xb)].

On observe alors que l’inverse de la covariance d’erreurSa de l’estimateur optimal

xa est l’information de Fisher des pdf des informations disponibles dans l’Eq. V.16. Le

2. S’il y avait une pondération particulière des produits satellites, alors ce ne serait pas des 1 dans la matrice

premier terme à droite est lié à l’informationa priorifournie par l’ébauche xb. Puisque l’objectif de ce travail est d’obtenir une estimation des composantes du cycle de l’eau indépendante des modèles, cette ébauche doit provenir de la climatologie et non de la ré-analyse. Si pour l’ébauche on considérait la prévision d’un modèle, comme par exemple dans le cadre d’un filtre de Kalman, l’estimateur optimal serait alors identique à l’assimilation avec une contrainte d’égalité dans la mise à jour du vecteur d’état du système. Cette approche présentée par Pan et Wood (2006) est détaillée dans la Sec-tion V.1.2. Le deuxième terme est lié aux observaSec-tions satellites rassemblées dans y2. Le troisième terme représente la contrainte de fermeture du bilan hydrique avec une matrice de covariance d’erreurQ1. L’estimateur optimal peut être utilisé sans l’informa-tiona priori xb, mais, bien sûr, cela nuirait à la qualité de la solution.

1.1.d Vers une méthode plus simple : Filtrage post-traitement

Aires (2014) montre que la solution optimale trouvée précédemment est très proche d’un simple Filtrage post-traitement (PF) introduit par Pan et Wood (2006) et appliqué directement sur un premier estimateur lié aux données satellites : le produit issu de la méthode SW, vu dans la partie précédente.

Soit xSW l’estimation obtenue du vecteur d’état x par pondération des produits sa-tellites disponibles (voir Chapitre 4, Section 3.2.b). On a une information surxSW par sa matrice de covariance B liée aux incertitudes des produits dérivés satellites. On peut alors appliquer la contrainte de fermeture 0 = H1· x déterministe (avec H1 défini dans l’Eq.(V.13)) et obtenir l’estimation du vecteur d’état avec un bilan hydrique équilibré :

xP F= xSW+ K (0 − H1· xSW) (V.17) = KP F· xSW,

K = B Ht

1(H1B H1t)−1 etKP F = [I d − K H1] avecI d la matrice identité.

L’approche PF a été utilisée dans cette thèse pour mettre en place la contrainte hy-drologique mais plusieurs améliorations ont été apportées et celles-ci seront détaillées dans la section V.2.