5.2 Le filtre de Kalman dans les modèles d’océans
5.2.1 Expression de l’EKF dans les modèles d’océans
Le problème de l’assimilation de données par filtrage dans un modèle océanique obéit au principe
général introduit précédemment : on veut obtenir une bonne estimation aux dates {t
k} des états
x
tk, qui sont les meilleures représentations de l’état réel de l’océan dans l’espace d’état de ce modèle.
Cette estimation sert à la réinitialisation du modèle (ou correction de l’état du modèle), et elle se
base sur la connaissance d’observationsy
kde l’état réel de l’océan. La correction est parfois étendue
à certains paramètres du modèle lui-même (comme les paramètres atmosphériques, cf Skachko et
al. 2006, mais nous n’avons pas mis en place ce genre de procédure dans cette thèse) : l’espace
d’estimation, comme on le verra en section 5.2.2 et au chapitre 7 ne correspond en fait généralement
pas à l’espace d’état. Le nombre d’observations instantanées y est en général très faible pour les
systèmes océaniques, de sorte qu’on n’opère pas de correction à chaque acquisition de mesure. Au lieu
de cela, on accumule les observations régulièrement pour les utiliser en des temps{t
k}suffisamment
espacés pour que l’échantillonnage associé à chaque vecteur y
ksoit suffisant
14. La constance des
écartst
k−t
k−1en fonction dekqui est généralement adoptée a des conséquences importantes pour
la paramétrisation des filtres d’assimilation séquentiels.
Le fait d’avoir recours à des méthodes dérivées du filtre de Kalman (telles que présentées dans
la section précédente) impose de ramener le problème à un système semblable à (5.31), malgré le
caractère très complexe que présente un système océanique, comparativement à ceux pour lesquels le
filtre de Kalman a d’abord été développé. Le modèle consiste en général en un système d’équations
non-linéaires aux dérivées partielles (cf chapitre 2). Les observations de l’océan sont également en
14
Il existe des moyens pour prendre en compte le décalage temporel qui existe entre les dates d’observations et les
dates{t
k}où elles sont utilisées.
grande partie liées à l’état du modèle par des opérateurs d’observation complexes (surtout avec un
modèle comme HYCOM, du fait de la complexité de la coordonnée verticale). Aussi, l’application
des principes du filtre de Kalman à l’océanographie doit d’abord s’accommoder nécessairement de
l’emploi d’opérateurs et d’une dynamique non-linéaires, ce qui interdit de ramener le problème à
un système semblable à (5.8). On travaille alors avec des filtres d’assimilation séquentiels dérivés de
l’EKF.
On ramène le problème de l’assimilation de données à l’étude d’un système semblable à (5.31)
de la façon suivante : entre t
k−1et t
k, l’évolution de x
tk∈ R
nn’est pas parfaitement régie par
l’application du modèle m
k(dont les limitations sont nombreuses, on verra la liste des principales
en section 5.2.3) à valeur dans R
n, parfois fortement non linéaire. L’impossibilité de caractériser
l’erreur modèle qui en découle de façon déterministe (cf Cohn 1997) impose de la caractériser de
façon stochastique. L’erreur modèle est encore considérée comme un bruit blanc gaussienη
kà valeur
dansR
n. At
0, l’incertitude sur la condition initiale (dont on s’est fait une idée au chapitre 4) est àl’origine de l’aspect stochastique de x
t0. Ce sont les aspects stochastiques de η
ket de x
t0qui sont à
l’origine de l’aspect stochastique de x
tk,∀k∈N.
On possède aux datest
kdes observationsy
k∈R
papportant des informations sur l’étatx
tkselon
le même type de relation que ce que l’on a vu précédemment. En effet la transformationh
kde l’espace
d’état décrit parR
nsur l’espace d’observation décrit parR
pest entachée d’erreurs, groupées sous le
terme d’erreur d’observation, et provenant principalement de deux sources : l’erreur de mesure des
instruments utilisés pour l’observation, et l’erreur de représentativité de l’état réel dans le modèle
nécessairement discret (Cohn 1997 donne une idée plus précise de l’erreur de représentativité).
Globalement l’erreur d’observation ne peut être caractérisée de façon déterministe. On la note
ǫ
ok∈ R
pà t
k. {ǫ
ok} et de ce fait {y
k} sont alors considérées comme des processus stochastiques.
{ǫ
ok
} est ainsi supposé être un bruit blanc gaussien. L’indépendance des erreurs {η
k}, {ǫ
ok
} et de
la condition initiale x
t0est a priori légitimement posée (bien que les problèmes de représentativité
du modèle concernent à la fois les erreurs η
ket ǫ
ok). Aussi, on est amené à considérer, pour tenter
d’estimer x
tk, le système non-linéaire (dynamique stochastique) semblable à (5.31) suivant :
x
tk=m
k(x
tk−1
) +η
ky
k=h
k(x
tk) +ǫ
ok(5.44)
où les hypothèses sur les variables sont les mêmes qu’en section 5.1 :
-{x
tk},{y
k},{η
k} et{ǫ
ok} prennent respectivement leurs valeurs dansR
n,R
p,R
netR
p.
- ∀k∈N, les fonctions m
ket h
ksont définies sur R
n, à valeurs respectivement dans R
netR
p.
On suppose que m
keth
ksont dérivables.
- {η
k} et{ǫ
ok} sont des bruits blancs gaussiens (de covariances respectives Q
ket R
k)
indépen-dants entre eux et indépenindépen-dants de la condition initiale x
t0.
La linéarisation d’un tel système se fonde généralement sur celle que l’on a vu pour le filtre de
Kalman étendu avec le système (5.41) mais elle peut varier selon les systèmes employés en pratique.
En particulier, on fait la plupart du temps en sorte que les linéarisations de m
keth
kn’introduisent
pas de termes constantsx
ak−1m
′k
(x
ak−1
),x
fkh
′k
(x
fk),h
ketm
k. On verra cependant que les termesh
ket m
kpeuvent réapparaître sous la forme de biais sur les erreurs modèle ou d’observation lorsque
l’hypothèse de bruit blanc gaussien n’est pas totalement vérifiée
15. Quoi qu’il en soit, les méthodes
classiques de filtrage en océanographie sont déclarées dérivées de l’EKF.
15
Cet aspect de la linéarisation du système a son importance pour le choix des meilleurs estimés avec les méthodes
d’ensemble (cf les chapitres 6, 8 et 9).
Le système à résoudre devient donc
x
tk=M
kx
tk−1+η
ky
k=H
kx
tk+ǫ
ok(5.45)
où M
ketH
ksont les opérateurs linéaires tangents associés àm
keth
k.
Le filtre de Kalman étendu qui est alors utilisé est le suivant entre t
iett
i+1:
Prévision : x
f
i+1
=m
i+1(x
ai)
P
fi+1=M
i+1P
aiM
Ti+1+Q
i+1(5.46)
et
Analyse :
x
ai+1=x
fi+1+K
i+1[y
i+1−h
i+1(x
fi+1)]
P
ai+1= [I−K
i+1H
i+1]P
fi+1K
i+1=P
fi+1H
Ti+1[H
i+1P
fi+1H
Ti+1+R
i+1]
−1(5.47)
At
0on a vu qu’une analyse était également possible suivant (5.47), avec
x
f0=x
t0et P
f0=P
0(5.48)
Le filtre opère successivement les phases de prévision et d’analyse :
- Les équations (5.46) montrent les effets de l’application du modèle opérée entre t
iet t
i+1à
partir de l’état x
ai, et la propagation par ce modèle des erreurs sur cet état.
- Les équations (5.47) de l’analyse traduisent le calcul de l’estimationx
ai+1comme une correction
de la prévision x
fi+1prenant en compte une partie de l’innovationy
i+1−h
i+1(x
fi+1) selon le poids
de la matrice de gain K
i+1. Ce gain peut être vu comme le rapport entre la variance de l’erreur
de prévision et la variance de l’erreur totale projetée dans l’espace d’observation. Plus l’erreur de
prévision est grande, plus la correction de x
fi+1en x
ai+1est importante et inversement si l’erreur
d’observation est grande, on ne corrige que très peu l’estimation entre x
fi+1etx
ai+1.
Certains points de la démonstration probabiliste du filtre de Kalman précédemment donnée sont
généralement présentés sous un angle différent en océanographie, où le problème d’estimation n’est
d’ailleurs pas posé de façon générale pour{t
k}mais de façon récurrente à unt
kfixé (les hypothèses
du problème étant entièrement reposées à t
k, avec notamment l’hypothèse d’indépendance de ǫ
fk,
η
k, et ǫ
oket celles de leur caractère gaussien). On reprend alors en général le fait que x
fi+1et x
ai+1sont des estimateurs de x
ti+1sans biais
16en écrivant directement qu’àt
i+1ǫ
fi+1=ǫ
ai+1= 0.
Alors que l’estimation de moindres carrés a été vue à travers le concept de l’estimation de
minimum de variance par la moyenne conditionnelle, elle est plus couramment présentée (selon une
démonstration alternative) comme la minimisation effective de la fonction coût :
16
J(x) = (x
fi+1−x)
T(P
fi+1)
−1(x
fi+1−x) + (y
i+1−H
i+1x)
TR
−i+11(y
i+1−H
i+1x) (5.49)
Le fait que l’estimation de minimum de variancex
ai+1soit la combinaison optimale entre l’état
prédit x
fi+1et l’information observée est assurée par le fait que J
′(x
ai+1