• Aucun résultat trouvé

5.2 Le filtre de Kalman dans les modèles d’océans

5.2.1 Expression de l’EKF dans les modèles d’océans

Le problème de l’assimilation de données par filtrage dans un modèle océanique obéit au principe

général introduit précédemment : on veut obtenir une bonne estimation aux dates {t

k

} des états

x

tk

, qui sont les meilleures représentations de l’état réel de l’océan dans l’espace d’état de ce modèle.

Cette estimation sert à la réinitialisation du modèle (ou correction de l’état du modèle), et elle se

base sur la connaissance d’observationsy

k

de l’état réel de l’océan. La correction est parfois étendue

à certains paramètres du modèle lui-même (comme les paramètres atmosphériques, cf Skachko et

al. 2006, mais nous n’avons pas mis en place ce genre de procédure dans cette thèse) : l’espace

d’estimation, comme on le verra en section 5.2.2 et au chapitre 7 ne correspond en fait généralement

pas à l’espace d’état. Le nombre d’observations instantanées y est en général très faible pour les

systèmes océaniques, de sorte qu’on n’opère pas de correction à chaque acquisition de mesure. Au lieu

de cela, on accumule les observations régulièrement pour les utiliser en des temps{t

k

}suffisamment

espacés pour que l’échantillonnage associé à chaque vecteur y

k

soit suffisant

14

. La constance des

écartst

k

−t

k1

en fonction dekqui est généralement adoptée a des conséquences importantes pour

la paramétrisation des filtres d’assimilation séquentiels.

Le fait d’avoir recours à des méthodes dérivées du filtre de Kalman (telles que présentées dans

la section précédente) impose de ramener le problème à un système semblable à (5.31), malgré le

caractère très complexe que présente un système océanique, comparativement à ceux pour lesquels le

filtre de Kalman a d’abord été développé. Le modèle consiste en général en un système d’équations

non-linéaires aux dérivées partielles (cf chapitre 2). Les observations de l’océan sont également en

14

Il existe des moyens pour prendre en compte le décalage temporel qui existe entre les dates d’observations et les

dates{t

k

}où elles sont utilisées.

grande partie liées à l’état du modèle par des opérateurs d’observation complexes (surtout avec un

modèle comme HYCOM, du fait de la complexité de la coordonnée verticale). Aussi, l’application

des principes du filtre de Kalman à l’océanographie doit d’abord s’accommoder nécessairement de

l’emploi d’opérateurs et d’une dynamique non-linéaires, ce qui interdit de ramener le problème à

un système semblable à (5.8). On travaille alors avec des filtres d’assimilation séquentiels dérivés de

l’EKF.

On ramène le problème de l’assimilation de données à l’étude d’un système semblable à (5.31)

de la façon suivante : entre t

k1

et t

k

, l’évolution de x

tk

∈ R

n

n’est pas parfaitement régie par

l’application du modèle m

k

(dont les limitations sont nombreuses, on verra la liste des principales

en section 5.2.3) à valeur dans R

n

, parfois fortement non linéaire. L’impossibilité de caractériser

l’erreur modèle qui en découle de façon déterministe (cf Cohn 1997) impose de la caractériser de

façon stochastique. L’erreur modèle est encore considérée comme un bruit blanc gaussienη

k

à valeur

dansR

n

. At

0, l’incertitude sur la condition initiale (dont on s’est fait une idée au chapitre 4) est à

l’origine de l’aspect stochastique de x

t0

. Ce sont les aspects stochastiques de η

k

et de x

t0

qui sont à

l’origine de l’aspect stochastique de x

tk

,k∈N.

On possède aux datest

k

des observationsy

k

∈R

p

apportant des informations sur l’étatx

tk

selon

le même type de relation que ce que l’on a vu précédemment. En effet la transformationh

k

de l’espace

d’état décrit parR

n

sur l’espace d’observation décrit parR

p

est entachée d’erreurs, groupées sous le

terme d’erreur d’observation, et provenant principalement de deux sources : l’erreur de mesure des

instruments utilisés pour l’observation, et l’erreur de représentativité de l’état réel dans le modèle

nécessairement discret (Cohn 1997 donne une idée plus précise de l’erreur de représentativité).

Globalement l’erreur d’observation ne peut être caractérisée de façon déterministe. On la note

ǫ

ok

∈ R

p

à t

k

. {ǫ

ok

} et de ce fait {y

k

} sont alors considérées comme des processus stochastiques.

o

k

} est ainsi supposé être un bruit blanc gaussien. L’indépendance des erreurs {η

k

}, {ǫ

o

k

} et de

la condition initiale x

t0

est a priori légitimement posée (bien que les problèmes de représentativité

du modèle concernent à la fois les erreurs η

k

et ǫ

ok

). Aussi, on est amené à considérer, pour tenter

d’estimer x

tk

, le système non-linéaire (dynamique stochastique) semblable à (5.31) suivant :

x

tk

=m

k

(x

t

k−1

) +η

k

y

k

=h

k

(x

tk

) +ǫ

ok

(5.44)

où les hypothèses sur les variables sont les mêmes qu’en section 5.1 :

-{x

tk

},{y

k

},

k

} et

ok

} prennent respectivement leurs valeurs dansR

n

,R

p

,R

n

etR

p

.

- k∈N, les fonctions m

k

et h

k

sont définies sur R

n

, à valeurs respectivement dans R

n

etR

p

.

On suppose que m

k

eth

k

sont dérivables.

- {η

k

} et

ok

} sont des bruits blancs gaussiens (de covariances respectives Q

k

et R

k

)

indépen-dants entre eux et indépenindépen-dants de la condition initiale x

t0

.

La linéarisation d’un tel système se fonde généralement sur celle que l’on a vu pour le filtre de

Kalman étendu avec le système (5.41) mais elle peut varier selon les systèmes employés en pratique.

En particulier, on fait la plupart du temps en sorte que les linéarisations de m

k

eth

k

n’introduisent

pas de termes constantsx

ak1

m

k

(x

a

k−1

),x

fk

h

k

(x

fk

),h

k

etm

k. On verra cependant que les termes

h

k

et m

k

peuvent réapparaître sous la forme de biais sur les erreurs modèle ou d’observation lorsque

l’hypothèse de bruit blanc gaussien n’est pas totalement vérifiée

15

. Quoi qu’il en soit, les méthodes

classiques de filtrage en océanographie sont déclarées dérivées de l’EKF.

15

Cet aspect de la linéarisation du système a son importance pour le choix des meilleurs estimés avec les méthodes

d’ensemble (cf les chapitres 6, 8 et 9).

Le système à résoudre devient donc

x

tk

=M

k

x

tk1

k

y

k

=H

k

x

tk

ok

(5.45)

où M

k

etH

k

sont les opérateurs linéaires tangents associés àm

k

eth

k

.

Le filtre de Kalman étendu qui est alors utilisé est le suivant entre t

i

ett

i+1

:

Prévision : x

f

i+1

=m

i+1

(x

ai

)

P

fi+1

=M

i+1

P

ai

M

Ti+1

+Q

i+1

(5.46)

et

Analyse :

x

ai+1

=x

fi+1

+K

i+1

[y

i+1

−h

i+1

(x

fi+1

)]

P

ai+1

= [I−K

i+1

H

i+1

]P

fi+1

K

i+1

=P

fi+1

H

Ti+1

[H

i+1

P

fi+1

H

Ti+1

+R

i+1

]

1

(5.47)

At

0

on a vu qu’une analyse était également possible suivant (5.47), avec

x

f0

=x

t0

et P

f0

=P

0

(5.48)

Le filtre opère successivement les phases de prévision et d’analyse :

- Les équations (5.46) montrent les effets de l’application du modèle opérée entre t

i

et t

i+1

à

partir de l’état x

ai

, et la propagation par ce modèle des erreurs sur cet état.

- Les équations (5.47) de l’analyse traduisent le calcul de l’estimationx

ai+1

comme une correction

de la prévision x

fi+1

prenant en compte une partie de l’innovationy

i+1

−h

i+1

(x

fi+1

) selon le poids

de la matrice de gain K

i+1

. Ce gain peut être vu comme le rapport entre la variance de l’erreur

de prévision et la variance de l’erreur totale projetée dans l’espace d’observation. Plus l’erreur de

prévision est grande, plus la correction de x

fi+1

en x

ai+1

est importante et inversement si l’erreur

d’observation est grande, on ne corrige que très peu l’estimation entre x

fi+1

etx

ai+1

.

Certains points de la démonstration probabiliste du filtre de Kalman précédemment donnée sont

généralement présentés sous un angle différent en océanographie, où le problème d’estimation n’est

d’ailleurs pas posé de façon générale pour{t

k

}mais de façon récurrente à unt

k

fixé (les hypothèses

du problème étant entièrement reposées à t

k

, avec notamment l’hypothèse d’indépendance de ǫ

fk

,

η

k

, et ǫ

ok

et celles de leur caractère gaussien). On reprend alors en général le fait que x

fi+1

et x

ai+1

sont des estimateurs de x

ti+1

sans biais

16

en écrivant directement qu’àt

i+1

ǫ

fi+1

ai+1

= 0.

Alors que l’estimation de moindres carrés a été vue à travers le concept de l’estimation de

minimum de variance par la moyenne conditionnelle, elle est plus couramment présentée (selon une

démonstration alternative) comme la minimisation effective de la fonction coût :

16

J(x) = (x

fi+1

−x)

T

(P

fi+1

)

1

(x

fi+1

−x) + (y

i+1

−H

i+1

x)

T

R

i+11

(y

i+1

−H

i+1

x) (5.49)

Le fait que l’estimation de minimum de variancex

ai+1

soit la combinaison optimale entre l’état

prédit x

fi+1

et l’information observée est assurée par le fait que J

(x

a

i+1

) = 0. On peut retrouver

alors le système (5.47) à partir de cette égalité.