• Aucun résultat trouvé

Conception optimale d’un réseau pour l’assimilation de données

2.3 Conception d’un réseau optimal de mesures

2.3.4 Conception optimale d’un réseau pour l’assimilation de données

Dans cette partie, nous donnons un bref aperçu sur la technique dite du ciblage des observations en temps réel, qui peut être considérée comme étant une extension natu- relle du problème de l’assimilation de données. Il s’agit de définir une certaine stratégie

afin de choisir les meilleurs endroits pour collecter des observations supplémentaires. Ces observations seront donc assimilées ensemble avec d’autres observations issues d’un réseau fixe afin d’améliorer la qualité d’une prévision produite par un certain modèle numérique. Le problème du ciblage des observations en temps réel a été largement étudié dans le contexte de la prévision numérique du temps. L’exemple typique où cette approche a constitué un outil pertinent, est celui de l’expérience FASTEX (Fronts and Tropical Storm- Tracks Experiment-Snyder (1996), Joly et al. (1997)). Cette expérience avait pour objectif de prévoir les conditions météorologiques favorisant le développement des tempêtes sur l’ouest de l’Europe, en se basant sur des observations collectées par des avions de mesures sur l’Atlantique Nord. Le problème était donc de définir au préalable les trajectoires de vol optimaux afin d’avoir le maximum d’information et d’améliorer ainsi la précision sur les prévisions météorologiques ultérieures. Dans ce qui suit, nous allons présenter le problème de ciblage d’observations en s’inspirant essentiellement du travail de Berliner et al. (1999). Soit 𝑿0 ∈ ℝ𝑝 un vecteur p-dimensionnel représentant, par exemple l’état de l’atmo-

sphère (ou d’un autre système dynamique) au temps 𝑡0. À un certain temps 𝑡1> 𝑡0, nous

prendrons des observations représentées par un vecteur q-dimensionnel 𝒀 ∈ ℝ𝑞 dont la

distribution dépendra de 𝑿1, le vecteur d’état du système au temps 𝑡1. Ces observations

à leur tour seront utilisées pour prévoir l’état 𝑿2 de l’atmosphère à un temps 𝑡2 > 𝑡1.

Le problème du ciblage des observations est alors de déterminer le vecteur d’observations 𝒀, à partir d’un ensemble de choix possibles, afin d’optimiser la prévision de 𝑿2. Dans

l’atmosphère, l’implémentation d’un schéma de ciblage des observations est extrêmement compliqué principalement pour deux raisons. La première, vient du fait que les dimensions sont très grandes : 𝑝 ≈ 107, 𝑞 ≈ 105. Des techniques statistiques standards comme le

filtre de Kalman ne sont pas facilement implémentables dans un tel contexte. La deuxième complication provient du fait que les systèmes observés sont en réalité non-linéaires et chaotiques. Il semble donc qu’une implémentation effective d’une stratégie de ciblage des observations pour la prévision du temps requiert de nouveaux développements en analyse numérique.

L’évolution de la dynamique entre le temps 𝑡0 et 𝑡1 peut être représentée par l’équation

suivante :

𝑿1 = 𝑓 (𝑿0) , (2.44)

où 𝑓 est une fonction non-linéaire connue, déduite d’un certain modèle numérique. Nous supposons aussi que l’information totale disponible sur 𝑿0 est représentée par une dis-

tribution gaussienne multidimensionnelle d’une moyenne 𝝁0 et une matrice de covariance

𝑨0 :

𝑿0 ∼𝒩𝑝(𝝁0, 𝑨0) . (2.45)

𝑿1≈ 𝑓 (𝝁0) + 𝑭 (𝝁0) . (𝑿0− 𝝁0) ,

où 𝑭 désigne la matrice jacobienne de 𝑓 évaluée au point 𝝁0. Donc, en combinant ces

équations, nous obtenons que 𝑿1a approximativement une distribution gaussienne donnée

par :

𝑿1∼𝒩𝑝(𝝁1, 𝑩1) , (2.46)

𝝁1 = 𝑓 (𝝁0) ,

𝑩1 = 𝑭 (𝝁0) 𝑨0𝑭(𝝁0)𝑇.

Au temps 𝑡 = 𝑡0, nous décidons d’effectuer une expérience qui aura lieu au temps

𝑡= 𝑡1 afin de collecter de nouvelles observations. Désignons donc par 𝒀 = (𝒀𝑇1, 𝒀𝑇2

)𝑇 le vecteur total des observations au temps 𝑡1 : le vecteur 𝒀1 de taille 𝑞 − 𝑑 représente les

observations de routine provenant d’un réseau d’observations fixe. Au contraire, le vecteur 𝒀2 de dimension 𝑑 représente la partie des observations supplémentaires issues d’un réseau

mobile ℛ qui sera déployé au temps 𝑡1. Nous supposons aussi que le vecteur d’observations

𝒀 est une fonction du vecteur d’état 𝑿1 suivant le modèle suivant :

𝒀 = 𝑲𝑿1+ 𝝐, (2.47)

où 𝑲ℛ est une matrice de taille 𝑞 × 𝑝 connue. Nous supposons que le vecteur des erreurs

d’observations 𝝐 suit une loi gaussienne, 𝝐 ∼ 𝒩𝑞(0, 𝑹)où 𝑹est la matrice de covariance

d’erreur des observations. Il est important de noter la dépendance des matrices 𝑲ℛ, 𝑹ℛ

au réseau d’observations mobile ℛ. La matrice 𝑲ℛ peut être considérée comme étant un

opérateur linéaire d’observations permettant le passage de l’espace des vecteurs d’état vers l’espace des observations. Dans un contexte si simple, cette matrice peut être vue comme étant une matrice d’incidence, où chaque ligne ne contient que des valeurs nulles sauf une seule valant 1. En combinant (2.46) avec (2.47) nous obtenons :

𝒀 ∼𝒩𝑞(𝑲ℛ𝝁1, 𝑲ℛ𝑩1𝑲𝑇) . (2.48)

Au temps 𝑡 = 𝑡1, nous pouvons faire une mise à jour de l’information totale disponible

sur 𝑿1, en combinant les observations 𝒀 , avec toute l’information qu’on disposait avant,

qui est résumée par (2.46). Cette phase de mise à jour correspond à ce qu’on appelle en assimilation de données une phase d’analyse. Donc, à l’aide d’un calcul bayésien standard, la distribution conditionnelle de 𝑿1 donnant les observations 𝒀 est donnée par :

où 𝝁∗ = 𝝁1+ 𝑩1𝑲𝑇(𝑹+ 𝑲𝑩1𝑲𝑇 )−1 (𝒀 − 𝑲𝝁1) 𝑩∗ = 𝑩1− 𝑩1𝑲𝑇(𝑹ℛ+ 𝑲ℛ𝑩1𝑲𝑇 )−1 𝑲𝑩1.

Notons que la matrice de covariance 𝑩∗ mise à jour est indépendante des observations

actuelles 𝒀 . Par conséquent, que nous pouvons utiliser cette matrice comme un critère d’optimalité afin de chercher le meilleur réseau mobile ℛ permettant d’avoir la meilleure estimation du vecteur d’état 𝑿1, au lieu de chercher à optimiser la prévision de 𝑿2. En

effet, ceci est complètement justifié du fait que, une meilleure estimation de 𝑿1 entraînera

une prévision raisonnable de 𝑿2.

À l’étape de prévision, la dynamique du système entre 𝑡1 et 𝑡2 est décrit par l’équation

suivante :

𝑿2= 𝑔 (𝑿1) , (2.50)

où 𝑔 est un opérateur non linéaire connue. Donc, si on applique de nouveau l’approximation tangente à cette équation, nous obtiendrons la distribution conditionnelle approximative de 𝑿2 sachant 𝒀 :

𝑿2∣∼𝒩𝑝(𝝁2, 𝑩2) , (2.51)

𝝁2 = 𝑔 (𝝁∗)

𝑩2 = 𝑮 (𝝁∗) 𝑩∗𝑮(𝝁∗)𝑇 .

La matrice 𝑮 est la matrice jacobienne de la fonction 𝑔 évaluée au point 𝝁∗. Ce qui signifie

alors que la matrice de covariance d’erreur de prévision dépend des observations 𝒀 à travers 𝝁∗. Cela rend difficile la définition d’un certain critère d’optimalité Ψ basé directement sur cette matrice. Une solution est de considérer la quantité 𝑮 (𝝁1) 𝑩1𝑮(𝝁1)

𝑇 au lieu de 𝑩 2.

Désignons par Ψ un certain critère d’optimalité convenablement choisi. Le problème du ciblage des observations se résume donc à chercher le meilleur réseau mobile ℛ optimisant la quantité :

Ψ (𝑺) = Ψ (𝑮 (𝝁1) 𝑩∗𝑮(𝝁1)) .

Si nous prenons le cas de D-optimalité, c’est-à-dire la minimisation du déterminant de la matrice 𝑺ℛ, nous obtenons :

Comme la quantité 𝑮 (𝝁1) 𝑇

𝑮(𝝁1)est constante, le problème d’optimisation est équivalent à celui de la minimisation du déterminant de la matrice 𝑩∗. Cependant, ce n’est pas le cas

par exemple pour la A-optimalité. En effet, on a :

tr(𝑮(𝝁1) 𝑩∗𝑮(𝝁1)𝑇)= tr(𝑩∗ 𝑮(𝝁1)𝑇 𝑮(𝝁1)). (2.52) Ce qui signifie que le problème d’optimisation par rapport à la meilleure prévision de 𝑿2

n’est pas équivalent à celui par rapport à la meilleure estimation de 𝑿1.

Cette introduction au problème du ciblage des observations, a constitué une base théo- rique sur laquelle nous nous sommes basés afin de définir une stratégie de ciblage des observations, couplée avec un schéma séquentiel d’assimilation de données, adaptée pour la surveillance des radionucléides dans un contexte accidentel. Cela sera abordé succincte- ment dans le chapitre 5 de ce manuscrit.