• Aucun résultat trouvé

1.4 Plan du manuscrit

2.1.2 Quelles sont les méthodes utilisées ?

Les travaux réalisés jusqu’à présent portent principalement sur l’échelle globale ou conti- nentale et utilisent plus souvent la méthode du filtre de Kalmann (Hartley et Prinn 1993; Haas-Laursen et al. 1996; Hein et al. 1997; Mahowald et al. 1997; Jacob et al. 2002; Wang et Bentley 2002; Gilliland et al. 2003) que celle de l’adjoint (Houweling et al. 1999; Mül- ler et Stavrakou 2005). À l’échelle régionale, trois des huit études disponibles utilisent le filtre de Kalmann (Mulholland et Seinfeld 1995; Chang et al. 1996; Chang et al. 1997) et quatre, la méthode de l’adjoint (Elbern et al. 1997; Elbern et Schmidt 1999; Elbern et al. 2000; Quélo et al. 2005).

Le filtre de Kalman

Originellement, cette méthode est séquentielle et basée sur la relation linéaire entre la modification des contraintes (des observations) et les paramètres pendant la même période (Hartley et Prinn 1993). Le but du filtre de Kalman est d’obtenir, à un instant donné, la meilleure estimation possible du vecteur d’état compte-tenu des observations disponibles à cet instant. Le principe de l’algorithme, basé sur la récurrence, est le suivant (Kalman 1960; Kalman et Bucy 1961; Lacarra et Talagrand 1988; Enting 2002) :

1- On dispose d’un modèle permettant :

– de relier, à n’importe quel instanttnle vecteur d’étatx(tn) aux variables observées

y(tn) grâce à l’opérateur d’observation Hnselon :ysim(tn) = Hnx(tn). .

– de prévoir le vecteur d’étatxf(t

n+1) à l’instant tn+1(xf(tn+1) est appelé prévision,f

pour «forecast») à partir de l’étatxa(t

n), analyse obtenue à l’instant précédent, soit :

xf(t

n+1) = Mn→n+1xa(tn), le modèle Mn→n+1étant valable entre les instantstnet

tn+1.

2- Les covariances d’erreur de la prévision xf(t

n+1), contenues dans Pfn+1, dépendent

alors des covariances d’erreur de l’analyse Pan et des covariances d’erreur du modèle correspondant à Mn→n+1, contenues dans Qn. On a : Pfn+1 = Mn→n+1PanMTn→n+1+

Qn. On remarquera que l’on suppose que les erreurs du modèle et les erreurs de l’ana-

lyse ne sont pas corrélées.

3- Le gain optimal Kn+1, qui contient les poids permettant d’effectuer l’analyse au temps

tn+1, dépend des covariances d’erreur de la prévision Pfn+1et des covariances d’erreur

d’observation correspondant à Hn+1, contenues dans Rn+1. Il est donné par : Kn+1 =

Pfn+1HTn+1[Hn+1Pfn+1HTn+1+Rn+1]−1. Pfn+1HTn+1contient donc les covariances d’er-

reur du modèle entre les points de grille et les points de mesure ; Hn+1Pfn+1HTn+1

réduit Pfn+1 aux seuls points de mesure.

4- Une fois les poids calculés dans Kn+1, on peut effectuer l’analyse de l’état au temps

tn+1, qui correspond à la prévision effectuée à la première étape «corrigée» par les va-

leurs utilisables au tempstn+1contenues dans le vecteuryobs(tn+1). On a : xa(tn+1) =

xf(t

n+1) + Kn+1[yobs(tn+1) − Hn+1xf(tn+1)]. Le vecteur yobs(tn+1) − Hn+1xf(tn+1)

contient simplement les écarts entre valeurs mesurées et valeurs simuléesyobs(tn+1) −

ysim(tn+1).

5- Enfin, on obtient les covariances d’erreur de la nouvelle analyse Pan+1grâce à : Pan+1 = [I − Kn+1Hn+1]Pfn+1.

Il est nécessaire d’initialiser la procédure avecxa(t

0) et Pa0

Les problèmes rencontrés en océanologie et météorologie étant en général non-linéaires, le filtre de Kalman dit étendu généralise l’algorithme à des modèles et des opérateurs d’observation non-linéaires en les linéarisant au voisinage de l’analyse à effectuer. Pour les problèmes fortement non-linéaires, il est possible d’utiliser le filtre de Kalman dit d’ensemble, introduit par Evensen (1994) et utilisant les méthodes stochastiques. Enfin, le lissage de Kalman («Kalman smoother» en anglais) permet d’étendre le filtre de Kalman à une fenêtre temporelle (Gelb 1974).

L’approche adjointe

Le principe de cette méthode variationnelle est résumé sur la Figure 2.1. À partir des forçages de la météo et des émissions, le modèle de chimie-transport direct (à gauche) fourni des champs de concentrations que l’on peut comparer aux observations effectuées. La modélisation inverse (représentée à droite) consiste à minimiser la différence entre les concentrations simulées et les concentrations observées en modifiant les émissions. La distance entre les concentrations simulées et les contraintes est représentée par une

fonction coût, qui doit donc être minimisée. La fonction coût bien choisie est calculée

par le modèle direct alors que son gradient par rapport aux paramètres (par exemple, les émissions) est fourni par l’adjoint. Celui-ci permet de calculer la dérivée d’une quantité simulée (par exemple, la concentration d’une espèce donnée dans une maille donnée) à tous les paramètres d’entrée (par exemple, tous les flux d’émissions). À partir de la valeur du coût et de son gradient en un point, un minimiseur permet de trouver la correction à apporter aux paramètres pour se rapprocher des observations et répète le cycle direct- adjoint jusqu’à obtenir d’une part un écart minimal entre variables simulées et observées et d’autre part les corrections qui lui correspondent c’est-à-dire l’ensemble de paramètres (par exemple le cadastre d’émissions) qui donne les meilleurs résultats de simulation. Il existe plusieurs choix de formulation du coût, adaptés aux différents problèmes traités. Cette fonction du vecteur d’état permet en général d’indiquer d’une part, à quel point on souhaite se rapprocher des contraintes et d’autre part, à quel point on peut s’éloigner des

CTM direct CTM adjoint Cmodele Cmodele

=

~ CTM direct Cobs Emissions Météorologie Observations Emissions ∆ + Minimisation

FIG. 2.1 – Principe de la modélisation inverse. CTM = Chemistry Transport Model

paramètres a priori. Le coût est donc exprimé le plus souvent à l’aide de deux vecteurs contenant, pour l’un, les différences entre les concentrations simulées et les contraintes correspondant, pour l’autre, les différences entre les paramètres optimisés et a priori. Elle prend alors la forme (Talagrand 1997; Elbern et al. 1997; Elbern et Schmidt 1999; Houweling et al. 1999; Elbern et al. 2000; Daley 1997; Prinn et Hartley 1995) :

J(x(t)) = (yobs(t) − Hx(t))TR(yobs(t) − Hx(t)) | {z } y(t) +(xf g(t) − x(t))TB(xf g(t) − x(t)) | {z } X(t) où :

• x(t) est le vecteur d’état ; t n’indique pas un instant dans le temps mais un état de l’optimisation

• H est l’opérateur d’observation

• y(t) est le vecteur qui contient les différences entre les concentrations simulées (yobs(t))

et les contraintes correspondant (ysim(t) = Hx(t))

• X(t) est le vecteur qui contient les différences entre les paramètres optimisés (x(t)) et a priori (xf g(t),f g pour «first-guess» ou ébauche)

• R est la matrice des covariances d’erreur d’observation Ses termes diagonaux cor- respondent directement aux variances et les termes extra-diagonaux représentent les éventuelles corrélations entre ces erreurs, qui peuvent être importantes par exemple dans le cas de mesures effectuées avec le même instrument, comme à bord d’un satel- lite.

• B est la matrice des covariances d’erreur du modèle et est souvent appelée matrice

«de background». Ses termes diagonaux sont des poids qui s’appliquent aux compo-

santes du vecteur des différences entre paramètres optimisés et a priori. Ils permettent donc de pénaliser les solutions de l’optimisation qui s’éloignent trop de l’a priori en prenant en compte son incertitude. Ceci est particulièrement utile dans les cas où cette incertitude n’est pas trop élevée. Les termes extra-diagonaux de la matrice «de back-

ground» permettent d’ajouter d’autres informations a priori dans l’espace des para- mètres à inverser telles que :

– des liens temporels. Ceci est particulièrement utile en météorologie puisque l’on traite des phénomènes continus. Si une erreur sur la température est constatée à l’heuret, la même erreur est très probablement présente à t + ∆t.

– des liens spatiaux. Les termes de la matrice établissent une corrélation spatiale entre les espèces émises au même moment dans tout le domaine. À l’échelle continen- tale, des fonctions de corrélation peuvent être élaborées pour représenter une zone cohérente comme un désert par exemple.