• Aucun résultat trouvé

Meilleur estimateur linéaire non biaisé (BLUE)

On cherche à déterminer un estimateur xa de l'état réel de l'atmosphère xt. Ces

deux vecteurs sont de dimension n, correspondant à la taille de l'espace modèle. On dispose d'une ébauche xb, de la même dimension que xt, et qui peut s'écrire sous la

forme :

I. Fondamentaux de l'assimilation de données 17 b est le vecteur des erreurs de l'ébauche. Cette ébauche fait oce de premier

estimateur de xt, que l'on va ensuite améliorer en utilisant les observations. Celles-ci

sont désignées par le vecteur yo, de dimension p. On a alors :

yo= Hxt+ o (2.2)

o est le vecteur des erreurs d'observation. H est la matrice de taille p × n, qui

permet de passer de l'espace modèle (de dimension n) à l'espace des observations (de dimension p). Dans le cas d'un modèle 1D, si la dimension de l'espace des ob- servations est inférieure à celle de l'espace modèle (ce qui est généralement le cas) et si les paramètres observés sont les mêmes que ceux qui sont modélisés, cette ma- trice représente simplement un ensemble d'interpolations qui permet de passer d'une grille verticale à une autre, possédant une résolution moins élevée.

On fait alors les hypothèses suivantes :

 Les erreurs o et b sont non biaisées, c'est-à-dire que E(o) = 0 et E(b) = 0 ;

 Les erreurs d'observation et de l'ébauche sont non corrélées entre elles, c'est- à-dire que E(o(b)T) = 0 et E(b(o)T) = 0.

On note B la matrice des variances/covariances d'erreur de l'ébauche, qui corres- pond à E(b(b)T), et R la matrice de variance/covariance des erreurs d'observation,

qui correspond à E(o(o)T). On dénit alors la fonction coût par

J(xa) = 1 2(xa− xb)TB−1(xa− xb) | {z } distance à l'ébauche +1 2(Hxa− yo)TR−1(Hxa− yo) | {z }

distance aux observations

(2.3) Cette fonction dépend de la distance entre l'estimateur et l'ébauche ainsi que de la distance entre l'estimateur et les observations ; les distances étant pondérées dans les deux cas par les covariances d'erreur de l'ébauche et des observations. On recherche alors la valeur de xa qui minimise la fonction coût. Ceci revient à

calculer l'estimateur qui est le plus proche des observations et de l'ébauche, les deux étant pondérées par leur variances/covariances d'erreur. Pour ce faire, on calcule le gradient de J par rapport à xa :

5xaJ = B−1(xa− xb) + HTR−1(Hxa− yo) (2.4)

La valeur de xa qui annule ce gradient est celle qui minimise la fonction coût.

On a alors :

xa= (B−1+ HTR−1H)−1(B−1xb+ HTR−1yo) (2.5) Ce qui peut s'écrire sous la forme

xa = xb+ K(yo− Hxb) (2.6)

une fois l'analyse xa connue, on peut estimer la matrice de variance-covariance

d'erreur de l'analyse A :

A = B − KHB (2.8)

xa est le meilleur estimateur linéaire non biaisé (Best Linear Unbiased Estima- tor ou BLUE) ou encore estimateur de Gauss-Markov. La matrice K est appelée matrice de gain de Kalman, qui détermine à quel point on modie l'ébauche pour obtenir l'estimateur nal xa. Le vecteur yo− Hxb représente la diérence entre les

observations et l'ébauche, exprimée dans l'espace des observations. Il est aussi appelé vecteur d'innovation. La formule (2.6) est à la base des algorithmes d'assimilation de donnée dits variationnels, comme le 3D-Var et le 4D-Var. Dans le cas des modèles 3D, les matrices en jeu ont une grande taille et ne peuvent être calculées directe- ment. En ce qui concerne les modèles 1D, la taille de l'espace modèle est petite, et celle de l'espace des observations est plus petite encore, ce qui nous permet de manipuler directement tous les vecteurs et matrices qui interviennent dans le calcul du meilleur estimateur linéaire non biaisé.

Les variances-covariances d'erreur d'observation (matrice R) sont en général ai- sées à obtenir, sauf pour les observations satellites que nous n'utiliserons pas dans le cadre de notre travail. Les variances d'erreur sont fournies par le fabricant du capteur, et l'on fait en général l'hypothèse que les erreurs d'observations sont décor- rélées entre elles, c'est-à-dire que l'erreur d'une observation donnée n'a aucun lien statistique avec les erreurs des autres observations. Ceci équivaut à assumer que la matrice R est diagonale.

Les variances-covariances d'erreur de l'ébauche (matrice B) sont en revanche beaucoup plus diciles à estimer. En eet, elles dépendent de l'erreur modèle, qui est mal connue et uctuante selon le temps et la verticale. D'autre part, les pro- cessus physiques et dynamiques intervenant dans le calcul de l'ébauche créent un lien entre les valeurs de l'ébauche aux diérents niveaux du modèle. On ne peut par conséquent faire l'hypothèse que les erreurs d'ébauche sont décorrélées entre elles : une erreur à un niveau donné de l'ébauche a un lien statistique plus ou moins fort avec les erreurs aux autres niveaux. Ces mêmes processus relient également entre elles, à des degrés divers, les variables pronostiques du modèle. Par conséquent, on ne peut exclure qu'une erreur sur une variable à un niveau donné ne soit corrélée à une erreur sur une autre variable à un autre niveau. Tout ceci fait qu'obtenir une matrice B proche de la réalité est ardu. Cependant, la connaissance de cette matrice est très importante, car elle détermine à quel point on fait conance à l'ébauche, pour telle variable et tel niveau, dans le calcul de l'estimateur xa. On sait par ailleurs

que la matrice B est symétrique et dénie positive. Le lien statistique entre une er- reur sur une variable à un niveau 1 et à un niveau 2 est le même que celui entre une

I. Fondamentaux de l'assimilation de données 19 erreur sur la même variable à un niveau 2 et à un niveau 1. Ceci n'est pas forcément vérié lorsque l'on considère plusieurs variables. En eet, le lien statistique entre une erreur sur une variable à un niveau 1 et celle sur une autre variable à un niveau 2 n'est pas forcément le même que celui entre une erreur sur la seconde variable au niveau 1 et sur la première au niveau 2. Ceci fait que, bien que la matrice B soit symétrique, certains des blocs la composant, concernant les covariances croisées entre deux variable, ne le sont pas forcément. Plusieurs méthodes ont été élaborées pour fournir une estimation de la matrice B.