Il est important de pouvoir comprendre et anticiper les effets de l’application des systèmes
déri-vés du filtre de Kalman sur modèle particulier, et tout particulièrement ceux de la paramétrisation
des matrices de covariances d’erreur dont on vient de voir le problème de l’estimation. Pour cela, la
caractérisation des structures de covariance d’erreur utilisées lors de l’analyse est utile et est facilitée
par l’utilisation des représenteurs (Echevin et al. 2000). La définition des représenteurs utilisée dans
cette thèse n’est pas exactement la définition standard introduite par Bennett 1992 pour laquelle
les représenteurs sont des fonctions de l’espace et du temps : Bennett et al. 1993introduisent ainsi
les représenteurs pour diminuer le coût de calcul de la minimisation de la fonction de coût en
as-similation variationnelle, en réduisant le nombre de degrés de liberté de l’optimisation au nombre
d’observations disponibles. On utilise donc la définition deEchevin et al. 2000 et nos représenteurs
peuvent être considérés comme des instantanés de représenteurs de Bennett. En reprenant les
équa-tions de (5.47), on voit que la correction du filtre de Kalman lors d’une étape d’analyse peut s’écrire
(en supprimant les indiçages temporels) :
x
a=x
f+x
c(5.70)
où x
cest une combinaison linéaire des colonnes de la matrice P
fH
T. x
cest donc une
combinai-son linéaire de l’ensemble des vecteurs {P
fH
Tscal} où H
scalest l’opérateur d’observation associé à
l’observation scalaire y
scalassimilée pendant la phase d’analyse (y
scalest une composante de y).
Dans le cas particulier où pendant la phase d’analyse, seul l’observation scalaire y
scalest assimilée
(si y = y
scalet H = H
scal, R étant alors un scalaire), x
cest proportionnel à P
fH
T. Ainsi, en
reprenant les équations de (5.47) on obtient :
x
c=λr où λ= y−Hx
f1 +
HPRfHT(5.71)
et
r= (P
fH
T)/(HP
fH
T) (5.72)
En particulier, si y −Hx
f= 1 et R = 0, x
c= r. r est appelé ici le représenteur associé à
l’observation scalaire y, et il donne donc la correction exacte opérée avec un filtre de Kalman à
partir d’une innovation unitaire sur y, avec une erreur d’observation nulle. Dans le cas général
de l’assimilation d’un ensemble d’observations scalaires, la correction réalisée est une combinaison
linéaire des représenteurs associés à ces observations.
Si le représenteur est associé avec une variable d’état x
idirectement observée (en notant x =
(x
1, x
2, ...x
m)), alors r = (r
1, r
2, ...r
m), où r
j=
cov(xj,xi)proche de celle des corrélations entre l’erreur surx
iet les erreurs sur les autres variables du système
x
j24.
Les représenteurs, en plus de fournir une information comparable à celle des calculs de
corré-lations pour l’exploration de la structure des matrices de covariance d’erreur, permettent donc de
caractériser l’influence exacte des observations sur l’état du modèle à travers l’emploi de
l’assimila-tion de données. Dans nos études à venir (en III), en adoptant l’hypothèse (5.69), (5.72) devient
r= (QH
T)/(HQH
T) (5.73)
La structure spatiale des représenteurs va donc permettre l’étude des estimations de l’erreur modèle
qui vont être réalisées.
5.4 Conclusion : importance de l’estimation des erreurs
On a décrit les principes fondamentaux des schémas dérivés du filtre de Kalman, dans leur
ap-plication à l’océanographie, en soulignant le problème de l’estimation des statistiques d’erreurs pour
leur paramétrisation. On a vu que pendant les étapes de prévisions, un grand nombre d’hypothèses
et d’approximations sont nécessaires à cette application, du fait du problème de l’estimation des
erreurs de prévisions. Que l’on travaille avec des schémas où la matrice de covariance d’erreur de
prévision est stationnaire ou non, une bonne prescription de sa composante liée à l’erreur modèle
est capitale pour le bon fonctionnement théorique du filtre. Les approches généralement mises en
oeuvre dans le filtre SEEK pour estimer l’erreur modèle, comme celle du facteur d’oubli, semblent
particulièrement mal adaptées à la caractérisation des erreurs dans un modèle régional en zone
côtière, et tout particulièrement à celles qui sont liées aux forçages atmosphériques et aux frontières
ouvertes, auxquelles on s’intéresse tout particulièrement dans cette thèse.
On a donc établi en fin de section 5.2.3 une démarche pour estimer de façon adaptée de cette
composante. Cette démarche repose sur l’usage des méthodes d’ensemble introduites au chapitre
6 et est à la base de nos études menées aux chapitres 8 et 9. L’interprétation des résultats de ces
études passera par l’emploi des représenteurs introduits en section 5.3 et par l’hypothèse de l’usage
d’un schéma d’assimilation stationnaire, que l’on mettra en oeuvre au chapitre 10.
24
On notera que suivant l’équation (5.72), la composante d’un représenteurr
jest sans dimension six
ietx
jont
la même unité physique ; dans le cas contraire, l’unité physique de la composante r
jest l’unité de x
jdivisée par
l’unité de x
i. Par exemple, si un représenteur associé avec une innovation de SSH est calculé, l’unité d’une de ses
composantes de vitesse ests
−1Estimation des statistiques d’erreur par
une méthode d’ensemble
On a vu au chapitre 5 que notre étude sur l’erreur modèle discutée dans les chapitres 8 et 9
s’appuierait sur l’emploi de méthodes de Monte Carlo, dont on présente ici le principe d’application
et l’utilité pour l’implémentation du filtre de Kalman. Les méthodes de Monte Carlo (c’est à dire
fondées sur l’usage d’échantillonnages aléatoires) ont été introduites en sciences de la Terre à la
fin des années 60 (Press 1968), et sont utilisées pour résoudre des problèmes très variés, dont les
problèmes inverses au sein desquels se place l’assimilation de données.
La prévision d’ensemble, ainsi que l’assimilation de données par méthode d’ensemble (dérivées
des méthodes de Monte Carlo), sont aujourd’hui assez fréquemment utilisées en géophysique. On
retrouve par exemple des systèmes de prévision d’ensemble en météorologie au MSC
1(avec l’EPS,
Ensemble Prediction System), au CEPMMT/ECMWF
2(Molteni et al. 1996), au NCEP
3(on trouve
une comparaison de ces trois derniers systèmes dans Buizza et al. 2005) ou à Météo France (basé
sur le modèle Arpège). L’aspect “chaotique” de la dynamique océanique ou atmosphérique rend
l’idée de prévision déterministe quelque peu inadaptée, malgré la prise en compte, dans les systèmes
d’assimilation de données, d’une erreur sur les prévisions. Son traitement à travers l’emploi de la
prévision par méthodes d’ensemble paraît plus approprié. Les méthodes d’ensemble permettent en
particulier de déceler des situations marginales extrêmes.
L’usage tout particulier des méthodes de Monte Carlo pour paramétrer les erreurs des filtres de
Kalman en océanographie culmine avec le développement du filtre de Kalman d’Ensemble (Ensemble
Kalman filtrer EnKF, introduit par Evensen 1994 pour un modèle d’océan quasi-géostrophique).
La description qu’on en donne illustre ce en quoi consiste la prédiction dynamique stochastique.
L’usage des méthodes de Monte Carlo dans le filtre de Kalman étendu permet d’une part de réduire
les coûts de calculs (notamment ceux de la deuxième équation de (5.46) du chapitre 5 : en ce sens
c’est une alternative, bien qu’elle s’avère plus coûteuse, à la réduction d’ordre déjà envisagée avec
un filtre dit “déterministe” comme le SEEK) ; il permet d’autre part d’estimer de façon plus réaliste
la structure des erreurs initiales et des erreurs modèles, supposées connues lors de l’application du
filtre de Kalman, et d’éviter certains problèmes qui se posent lorsque l’on néglige des moments des
erreurs d’ordre strictement supérieurs à 2. Les questions de compatibilité entre réinitialisations et
conditions aux frontières ouvertes dans les modèles régionaux sont également en principe mieux
1
Meteorological Service of Canada.
2Centre Européen pour les Prévisions Météorologiques à Moyen Terme/European Centre for Medium-Range
Wea-ther Forecasts.
3