• Aucun résultat trouvé

Chapitre II : la tomographie GPS

2.3 Le filtre de Kalman adaptatif

Le filtre de Kalman a été décrit pour la première fois par Rudolph E. Kalman (Kalman, 1960) pour des applications de contrôle de trajectoire. Le filtre de Kalman fonctionne d’après le principe d’estimations incrémentielles par moindres carrés : chaque nouvelle donnée est utilisée pour mettre à jour la solution précédente. Le filtre de Kalman permet aussi d’estimer les caractéristiques statistiques de variables aléatoires ou de prévoir l’évolution des variables. Cette technique s’applique bien pour des calculs lourds où il est impossible de refaire l’ensemble des calculs pour trouver la meilleure solution ou pour suivre l’évolution d’une solution variable dans le temps. Les applications civiles du filtre de Kalman sont nombreuses dans l’industrie pour le contrôle des processus automatisés, dans l’optique pour la reconstruction d’image, dans l’aéronomie pour l’orbitographie, dans le référencement des positions GPS, etc. Le filtre de Kalman est souvent utilisé sous des formes réduites en océanographie ou en météorologie pour suivre l’évolution de la structure et de la composition des océans ou de l’atmosphère. Si la formulation théorique du filtre de Kalman est simple, un des principaux problèmes de l’utilisation pratique est sa lourdeur de calcul. Dans le cas de la tomographie GPS, le nombre de données et la taille de la grille sont de dimensions modestes donc la forme exacte du filtre peut être utilisée. Le calcul incrémentiel de la solution est aussi sensible à la propagation des erreurs d’arrondis lors du calcul. Les erreurs numériques ainsi créées peuvent briser la symétrie et la positivité des matrices de covariance. Pour limiter ce genre de difficultés supplémentaires, la corrélation des erreurs est limitée à 1% minimum. A la fin de chaque cycle de correction / prédiction du filtre de Kalman, la positivité et la symétrie des matrices de covariance sont vérifiées.

Le filtre de Kalman (fig. 11) est un processus itératif en deux temps plus une étape d’initialisation qui définit l’ensemble des paramètres à To : une étape de correction où les données sont assimilées au temps T et une étape de prédiction où le modèle est évaluée à T+1.

peut alors les utiliser pour définir un champ initial et la covariance a priori. Cette étape est rarement critique car les données apportent suffisamment d’informations pour corriger ce champ initial. Sauf dans le cas d’une couche homogène au dessus du réseau, la tomographie ne pourra pas retrouver une distribution de vapeur d’eau réaliste car il existe une infinité de modèles qui minimisent l’écart aux données (par exemple un champ moyen). La matrice de covariance du modèle initial est construite à partir de la variabilité climatique calculée par Gradinarsky (2002) avec une longueur de corrélation des erreurs de 50 km en horizontal et de 1 km en vertical.

2.3.2 Etape 2 : la correction

Le principal intérêt du filtre de Kalman est d’utiliser les données à leur instant exact de mesure pour corriger le champ de densité de vapeur d’eau. Dans la pratique, il est nécessaire de définir un pas de temps au cycle prédiction / correction. Suivant le type de problématique scientifique pour laquelle la tomographie GPS est utilisée, le pas de temps varie entre 15 minutes et 1 heure. L’ensemble des données (ou des observations dans la suite du texte) entre deux pas de temps est utilisé dans la mesure du possible. Pour ne pas avoir un temps de calcul trop long, on utilise les SIWV échantillonnés à 5 minutes pour un pas de temps du filtre de Kalman de 15 minutes par exemple.

Il existe un grand nombre de formulations équivalentes mathématiquement de l’étape de correction de , le modèle prédit au temps t. La formule suivante a été choisie car elle limite les erreurs d’arrondis et les pertes de symétrie des matrices à l’origine des instabilités numériques :

t X

(

t t

)

t t t t I K M X K Y X = . . + . et , 1 . . . . + = 64 744 4 844 S y t T t x t t T t x t t C M M C M C K T t y t t T t t x t t t x t I K M C I K M K C K C =( . ). .( . ) + . . ,

avec Xt le modèle corrigé au temps t, le modèle prédit au temps t,

t X

Yt les observations au temps t,

Mt la matrice géométrique du problème au temps t,

I la matrice identité,

la matrice de covariance du modèle prédite au temps t,

x t

C

x la matrice de covariance du modèle corrigée au temps t,

t C

Kt le gain du filtre de Kalman au temps t (la matrice inversée lors du calcul du gain est appelée « Design Matrix » notée S par la suite),

la matrice de covariance des observations au temps t.

y t

C

Bien que la matrice S soit carrée, positive et symétrique, on ne calcule pas l’inverse de S mais l’inverse généralisé S-g. En effet, suivant la configuration des

satellites et le nombre de rais, l’inversion de la matrice S n’est pas stable numériquement. La matrice S est d’abord décomposée par la méthode de la décomposition en valeurs singulières selon la formulation suivante :

T V U S= .Λ. , avec U une matrice M*N orthogonale,

VT une matrice N*M orthogonale,

Les termes diagonaux de Λ sont appelés des valeurs singulières. Si toutes les valeurs singulières de la matrice S sont strictement positives, la matrice S est régulière et inversible. Dans la pratique lors du calcul de l’inverse de Λ, l’inverse des valeurs singulières inférieures à un seuil sont mises égales à zéro pour minimiser les erreurs d’arrondis. On peut ensuite retrouver l’inverse généralisé de S :

T

g V U

S = 1. , avec UT une matrice N*M orthogonale,

V une matrice M*N orthogonale,

Λ-1 la matrice diagonale N*N positive contenant l’inverse des valeurs singulières de S supérieures à un seuil et complétée par des zéros.

Figure 12: Représentation logarithmique des valeurs singulières de la matrice S inversée lors du calcul du gain K dans l’ordre décroissant. La plus petite valeur singulière utilisée est indiquée par un carré.

La décomposition en valeurs singulière est effectuée en utilisant une bi-diagonalisation de Householder (Golub et Reinsch, 1971). La dimension de Λ est donnée par le nombre de SIWV utilisés. Pour un réseau d’une vingtaine de stations GPS observant simultanément 6 satellites pendant une période de 15 minutes et un échantillonnage des SIWV de cinq minutes, cela représente environ 400 rais et donc 400 valeurs singulières de S. Chaque valeur singulière représente l’information apportée par le rai qui dépend de l’élévation du rai, de l’erreur sur la mesure du SIWV et de l’erreur sur le modèle de vapeur d’eau. Tous les rais ne sont pas égaux devant l’inversion. Les rais apportant très peu d’information ne sont donc pas fondamentaux. Ils dégradent même la résolution numérique de l’inversion de S en amplifiant les erreurs d’arrondis car leur valeur singulière associée est très petite. Il est donc nécessaire de les filtrer pour obtenir un résultat stable numériquement. Le rapport entre la valeur singulière la plus grande et la valeur singulière la plus petite

la matrice de covariance du modèle prédit au temps t+1,

x t

C+1

t

Xx le modèle corrigé au temps t,

la matrice de covariance du modèle corrigé au temps t,

t

C

Nt la matrice de transition du modèle entre le temps t et t+1,

Vt la matrice de covariance de l’erreur de transition Nt, le paramètre (0 ou 1) contrôlant le facteur d’oubli F

χ t qui est une matrice

diagonale.

La matrice Nt contrôle la transition entre les états de Xt et Xt+1. Il est possible de construire Nt à l’aide des équations de la physique et de données externes. Nt pourrait contenir un schéma d’advection de la vapeur d’eau contraint par des mesures de vents ou des conditions de précipitations. Dans ce cas le filtre de Kalman et la tomographie deviennent un (petit !) modèle numérique de météorologie avec de l’assimilation de données de vapeur d’eau. La problématique de ce travail concernant plutôt les applications des données GPS météorologiques, Nt ne contient aucune autre donnée ni loi de la physique. Nt est tout simplement une matrice identité. On suppose donc que l’état du champ de vapeur d’eau entre deux itérations est quasi identique. L’hypothèse est probablement réaliste avec un pas de 15 minutes pour les périodes calmes pendant la campagne ESCOMPTE (cf. chapitre 4) mais plus discutable pour les applications à des phénomènes comme la convection pendant la campagne IHOP (cf. chapitre 5). Ce problème est résolu si les SIWV apportent suffisamment d’information.

Figure 13: Variations temporelles des résidus moyens a priori projetés au zénith (différence entre les SIWV et les SIWV reconstruit à partir du champ de vapeur d’eau prédit). Les croix indiquent les itérations où le facteur d’oubli n’est pas nul. L’erreur a priori est proche de l’erreur instrumentale des SIWV GPS ce qui montre le bon fonctionnement du filtre de Kalman.

La matrice Vt caractérise l’erreur faite lors de la prédiction du champ de vapeur d’eau à l’instant suivant. Les termes diagonaux de Vt représentent la variabilité climatique de la vapeur d’eau dans chaque cellule (fonction de l’altitude) multipliée par une exponentielle du rapport entre le pas de temps du filtre de Kalman et un temps caractéristique d’une heure. Lors de l’étape de prédiction, il est

le degré possible d’ajustement du champ de vapeur d’eau par les données GPS. Si les variations temporelles de vapeur d’eau sont faibles alors Vt doit être petit et à l’inverse lors des périodes avec une forte dynamique Vt doit être suffisamment grand pour que le modèle du champ de vapeur d’eau puisse intégrer ces variations : c’est le filtrage adaptatif. Or cette erreur est très difficilement caractérisable car il faut connaître au moins au premier ordre les variations temporelles du champ de vapeur d’eau. La solution alternative est d’utiliser un facteur d’oubli Ft. L’erreur Vt de prédiction est laissée constante à des valeurs correspondant à la variabilité climatique du champ de vapeur d’eau. On considère que les variations temporelles typiques du champ de vapeur d’eau ont un temps caractéristique d’une heure avec une corrélation spatiale de 50 km (ces paramètres ne sont pas critiques pour l’inversion et ne modifient pas les résultats). Vt en surface est de l’ordre de 2 à 4 g/m3 par heure. A chaque étape de prédiction, on compare les SIWV mesurés avec les SIWV reconstruits d’après le modèle de vapeur d’eau prédit : les résidus de l’inversion. Si l’écart entre les mesures et les prédictions est supérieur à la moyenne long terme de cet écart, alors on rajoute sur la diagonale de la matrice de covariance de la solution un facteur d’oubli basé sur la variabilité climatique (fig. 13). Le facteur d’oubli permet « d’oublier » les contraintes apportées par les informations antérieures pour mieux suivre les variations actuelles. Les résidus moyens a priori projetés au zénith sont de l’ordre de 1 à 2 kg/m2, de l’ordre de grandeur de la précision des SIWV.

Documents relatifs