Application de l’assimilation de données

_k∇^∇^Φ_Φ_k

J(m0, mf,Φ) = Z Ω £ (mo−I(x))21_Φ(_x₎_<₀+ (mb−I(x))21_Φ(_x₎_≥₀^¤dx+ Z Γ |∇Φ(x)|dx,

∂Φ ∂τ ⁼ · ∇· µ ∇Φ ||∇Φ|| ¶ + (mb−I(x))2−(mo−I(x))2 ¸ δ(Φ),

Les algorithmes de résolution par méthode adjointe présentés précédemment permettent de

calculer simplement le gradient de fonctionnelles dépendant d’états de grandes dimensions. Pour

chaque application, un test peut être réalisé afin de vérifier la validité de la mise en œuvre du

modèle adjoint [50, 73]. En considérant un développement de Taylor de la fonction de coût J

autour deX, on a :

lim

J(X+αθ) =J(X) +α∇J·θ. (3.54)

L’intégration rétrograde de l’équation (3.48) permet elle aussi d’obtenir une valeur du gradient de

la fonction de coût au pointX. En utilisant ces deux relations, le système doit donc vérifier :

lim

J(X+αθ)−J(X)

α∇J·θ = 1. (3.55)

Le numérateur est alors calculé par différences finies, tandis que le dénominateur est obtenu par

la méthode adjointe. Pour une discrétisation correcte, ce rapport doit être proche de 1. Un profil

typique de ce rapport consiste à voir le ratio tendre vers 1 quandα → 0. Cependant, quand α

devient trop petit, le rapport se met à diverger à cause de l’accumulation des erreurs de troncatures

numériques. En effectuant ce test, on peut ainsi déterminer la valeur deα minimale vérifiant la

propriété (3.55). Cette valeur sert alors de borne pour la convergence de la méthode. Par exemple,

dans le cas de l’assimilation sous contrainte dynamique faible, on itèrera les intégrations directes

et adjointes tant que|dX(t

)|> α.

La convergence vers un minimum de la fonction de coût est ainsi assurée. Comme alternative à

la descente de gradient utilisée, différents algorithme peuvent être mis en œuvre pour optimiser

70 3.5 Application de l’assimilation de données

la convergence (Gradient conjugué, calcul du Hessien...). Cependant, si les opérateurs H etM

sont linéaires, la fonction de coût ne sera pas nécessairement quadratique, et la convergence vers

un minimum global ne sera pas assurée. Dans le cas non linéaire, le rôle de la valeur initialeX

de l’état (et des paramètres initiauxudu modèle) est ainsi primordial. En effet, si les conditions

initiales sont trop éloignées de la solution optimale, on convergera toujours vers un minimum

local.

3.5.2 Mise en œuvre du modèle adjoint

L’opérateur adjoint doit être l’exact adjoint numérique de l’opérateur direct pour pouvoir

res-pecter la condition (3.55) [168]. Dans la plupart des applications industrielles déjà existantes, les

codes sources correspondant au modèle direct sont très complexes, et des outils de différentiation

automatique sont utilisés pour la mise en œuvrea posteriori du modèle adjoint. Citons

TAPE-NADE [170], TAF [167], ADIFOR [2] ou ADOL-C [3] comme logiciels de différentiation

auto-matique les plus couramment utilisés. La mise en œuvre du modèle adjoint peut cependant être

expliqué schématiquement de manière simple. Si l’on considère le passage de la variable d’état du

tempst

au tempst

par une suite dentransformations :

X(t

) =T

◦T

◦ · · · ◦T

(X(t

)),

soit :

˜

X

=X(t

)

˜

X

=T

( ˜X(t

))

˜

X

=T

( ˜X

)

· · ·

˜

X

=T

( ˜X

)

X(t

) =T

( ˜X

),

alors le modèle adjoint réalisera :

λ(t

) =

µ

∂T

∂X˜

¶

α∇J·θ ^{= 1.} ^(3.55)

∂X^˜

∂X^˜

∂X^˜

· · ·X^˜