HAL Id: hal-00656503
https://hal.archives-ouvertes.fr/hal-00656503
Submitted on 17 Jan 2012
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Interpolation de données manquantes dans des séquences multi-modales d’images géophysiques satellitaires
Sileye Ba, Thomas Corpetti, Ronan Fablet
To cite this version:
Sileye Ba, Thomas Corpetti, Ronan Fablet. Interpolation de données manquantes dans des séquences
multi-modales d’images géophysiques satellitaires. RFIA 2012 (Reconnaissance des Formes et Intelli-
gence Artificielle), Jan 2012, Lyon, France. pp.978-2-9539515-2-3. �hal-00656503�
Interpolation de données manquantes dans des séquences multi-modales d’images géophysiques satellitaires
Silèye O. Ba † Thomas Corpetti ‡ Ronan Fablet † Lab-STICC † , Université Européenne de Bretagne, Plouzané, France
LIAMA-CNRS ‡ , Beijing, Chine
Résumé
Cet article étudie l’estimation conjointe de données man- quantes et de champs de déplacements dans des séquences multimodales d’observations satellitaires géophysiques.
La complexité de la tâche est liée au taux élevé de don- nées manquantes (entre 20% et 90%) pour des observa- tions journalières de haute résolution et la reconstruction de structures fines en accord avec la dynamique sous ja- cente. Nous avons développé une méthode basée sur l’as- similation variationnelle de données pour des séries mul- timodales et multi-résolutions. A l’aide de données synthé- tiques et de données réelles de la surface océanique, une évaluation numérique et qualitative démontre l’apport de deux composantes clés du modèle proposé : la fusion d’in- formations multimodales à partir d’une contrainte géo- métrique basée sur les structures frontales, et la méthode d’assimilation variationnelle utilisant comme à priori dy- namique un modèle d’advection-diffusion. Les expérimen- tations conduites montrent que de bonnes performances de reconstruction sont obtenues pour les observations hautes résolutions en dépit du pourcentage élevé de données man- quantes.
Mots Clef
Assimilation variationnelle de données, interpolation de données manquantes, inpainting
Abstract
In this paper we address the joint estimation of missing data and displacement field estimation from multi-modal geophysical satellite observation series. The complexity of this issue lies in the large percentage of missing data (typi- cally from 20% to 90% for daily high-resolution observa- tions) and the requirement for reconstructing dynamically coherent fine-scale structures in accordance with the un- derlying turbulent dynamics. We develop a variational data assimilation model for multi-resolution and multi-modal observation series. Using synthetic and real ocean surface observation series, numerical and qualitative evaluations demonstrate the relevance of two key components of the proposed model : the fusion of multi-modal observations through a geometric front-driven constraint and the pro- posed variational assimilation setting using an advection- diffusion dynamical prior. We show that good reconstruc-
tions of high-resolution geophysical observation series can be achieved despite high percentage of missing data.
Keywords
variational data assimilation, missing data interpolation, in- painting
1 Introduction
De nos jours la surface terrestre et les océans sont couverts par un réseau dense de satellites. De multiples satellites capturent des paramètres terrestres et océaniques à diffé- rentes résolutions. La température de la surface océanique (SST) en est un exemple particulier. La radiométrie micro- onde (MO) permet une capture à basse résolution (0.25
◦) [1] tandis que la radiométrie infrarouge (IR) délivre des mesures hautes résolutions (0.05
◦) [2].
La mesure de la SST est un activité importante car la SST est une observation clé dans des domaines tels que la pré- diction météorologique, l’étude de la circulation de l’océan et des effets du changement climatique [3, 4, 5, 6, 7]. Il est aussi à noter la relation établie entre la pluviométrie en Afrique et la température de surface des océans tropi- caux [3] ou la corrélation positive entre le réchauffement de la température de surface océanique et l’augmentation de l’activité cyclonique dans l’océan Atlantique [4, 5]. Ainsi, la SST est un marqueur de la dynamique océanique [6, 7].
La concentration de chlorophylle est aussi un paramètre océanique important. C’est un marqueur effectif de la pro- duction biologique de l’océan [8]. En tant que marqueur passif de l’activité océanique, les structures géométriques de la concentration de CHL sont fortement liées à celles exhibées par la SST. Toutes deux (CHL et SST), sont as- sociées à la circulation océanique globale et ainsi qu’aux structures de turbulence aux échelles fines [9]. Ainsi, la concentration de CHL et la SST sont des paramètres en forte interaction, et cette interaction pourrait être prise en compte lors de leur traitement [10, 11].
Les satellites géophysiques exploitent plusieurs modalités
(e.g, capteurs IR ou MO) associés à différentes résolutions
de capture comme illustré dans la Fig.1. Dans tous les cas,
ces capteurs sont sensibles aux conditions atmosphériques
telles que les fortes pluies ou la couverture nuageuse. Par
conséquence, les séries d’observations comportent de fort
pourcentage de données manquantes, les données hautes
résolutions étant plus affectées. Par exemple, dans la ré- gion de Malvinas considérée (voir Fig.1), les observations journalières de CHL en comportent entre 20% à 90%. L’in- terpolation de données manquantes dans les observations géophysiques est alors une étape de pré-traitement néces- saire [12, 13, 14]. Les produits opérationnels sont basés sur les techniques d’interpolation optimale, du filtrage ou du lissage de Kalman, ou des ensembles de filtres de Kalman [13, 14, 15, 16]. Leur limitations principales sont qu’ils re- quiérent le traitement de très larges matrices de covariance, et font des hypothèses statistiques telles que la stationna- rité, la Gaussiannité ou la linéarité sur le modèle dyna- mique. Ces hypothèses peuvent difficilement être réalisé pour des problèmes réels. En présence de fort taux de don- nées manquantes (voir Fig.1), un gain peut être attendu lors de la fusion d’observations multimodales et multi- résolutions. L’interpolation conjointe d’observations multi- résolution SST pourra améliorer le traitement des don- nées hautes résolutions, étant données que les observations basses résolution comportent beaucoup moins de données manquantes. De plus, dans le cas de données issues de modalités différentes (SST et CHL), les structures géomé- triques communes aux deux paramètres géophysiques, ser- viront à mieux contraindre le processus d’interpolation.
De façon formelle, la reconstruction d’observations géo- physiques peut être posée sous la forme d’interpolation de données manquantes à partir de séquence d’observations multimodales et multi-résolutions. Connues en vision par ordinateur sous la dénomination d’inpainting, les méthodes variationnelles ont été largement exploitées pour l’interpo- lation de données manquantes. Ces méthodes sont conçues pour supprimer du texte, des craquelures, ou même des objets d’images [18, 17]. Le problème considéré dans cet article admet aussi des liens avec le problème de super- résolution où des images basses résolutions d’une scène sont utilisées pour créer une version haute résolution de la même scène [20, 21, 22]. Contrairement au problème d’inpainting ou de super-résolution, le problème qui nous intéresse comprend une complexité additionnelle : – Comparé aux applications d’inpainting, les observations
comprennent de larges portions de données manquantes ce qui rend la reconstruction de la géométrie locale des structures présentes dans les images géophysiques parti- culièrement difficile ;
– Comparé aux problèmes classique d’inpainting et de super-résolution de champs multi-valués, dans le pro- blème considéré dans cet article, les séries d’observa- tions multimodales traitées ne partagent que l’organisa- tion spatiale des structures géométriques ;
– Les images géophysiques sont fortement structurées par le champ de déplacement sous jacent [23]. L’estimation jointe du champ de vitesse de la surface océanique ap- parait comme un facteur important pour recouvrer un champ dynamiquement cohérent.
Pour résoudre ces problèmes, nous proposons une méthode basée sur l’assimilation variationnelle qui, à partir de don-
nées multimodales et multi-résolution d’observations géo- physiques, estime de façon conjointe les données man- quantes et un champ de déplacement associé. Les perfor- mances des modèles proposées sont évaluées sur des don- nées synthétiques (simulation de modèle turbulence semi quasi-géostrophique [7]), et des données SST et CHL.
La suite de cet article est organisé comme suit. La Section 2 présente le modèle variationel pour l’estimation de don- nées manquantes et de champs de transport pour une sé- quence d’observations d’une seule modalité. La Section 3 présente la méthode multimodale d’interpolation de don- nées manquantes et de champs de transport. La Section 4 présente les expérimentations conduites pour l’évaluation des méthodes proposées. Finalement, la Section 5 donne les conclusions.
2 Interpolation de données man- quantes pour une série uni-modale
Dans cette section, nous supposons disposer d’une sé- quence d’observations I
t, t ∈ [t
0, t
f] correspondant à la séquence d’états θ
t, t ∈ [t
0, t
f] d’une variable géophy- sique. Dans notre cas, la variable d’état correspond soit à de la SST ou de la CHL. Les observations I
tcomprennent des données manquantes comme dans la Fig.1. La variable d’état est supposée liée à l’observation qui lui correspond par la relation I
t= P
tθ
t+ω
toù P
test un opérateur linéaire de projection qui modélise la réduction de dimensionna- lité due aux données manquantes
1. ω
treprésente un bruit Gaussien centré, indépendant, identiquement distribuée, de matrice covariance Σ.
Etant donné que les variables sont des marqueurs de la dy- namique océanique, elles sont liées à la circulation océa- nique, leur reconstruction doit comprendre comme à priori un modèle dynamique. Supposons que l’évolution tempo- relle des états soit soumise au modèle dynamique suivant :
∂
tθ + M (θ, ϑ) = η
tθ
t0= θ
0+ ε (1)
où θ
0est l’état initial, ε et η
t, de matrices de covariances B and Q, modélisent l’incertitude à propos de l’état ini- tial et du modèle dynamique
2. Ici, M (θ, ϑ) = ϑ∇θ − κ∆θ est un opérateur d’advection-diffusion, défini par le champ d’advection ϑ et le paramètre de diffusion κ. ∇ and ∆ dé- notent l’opérateur gradient et Laplacien. Le modèle d’ad- vection diffusion modélise le transport d’une variable par un champ de vecteurs ϑ et un taux de diffusion κ.
Etant donné le modèle dynamique (Eq.1), nous définissons un coût variationnel pour l’interpolation de donnée man- quantes et l’estimation de champs de transport par : J(θ, ϑ) =
Z
tft0
||∂
tθ + M (θ, ϑ)||
2Qdt + ||θ
t0− θ
0||
2B... (2)
+ Z
tft0
E(θ
t)dt
1
Les images sont représentées sous une forme vectorielle.
2
B et Q sont modélisées par des matrices diagonales et sphériques.
F IG . 1 – Observations géophysiques de l’océan pour la région de Malvinas située au large du Brésil. A droite : observation haute résolution IR (données METOP) ; au centre : observation basse résolution MO (données REMSS) ; à gauche : donnée medium résolution de mesures de concentration de CHL (données MERIS). Les données METOP possèdent une résolution 5 fois plus fine que les données REMSS, et deux fois plus fine que les données MERIS.
où E(θ) est un terme d’attache aux observations défini par :
E(θ) = Z
D(I)
(I − P θ)
2dp + β Z
D(θ)
||∇θ||
qqdp (3)
où D dénote le domaine de définition de son argument, β est un poids positif pondérant la contribution du terme de régularité dans le terme d’attache aux observations E.
||.||
Qreprésente la distance de mahalanobis par rapport à la matrice de covariance Q et ||.||
qest la norme L
q. Nous avons choisi q = 2.
La séquence de variables d’état et de champs de transport (ˆ θ
t, ϑ ˆ
t), t ∈ [t
0, t
f] minimisant la fonction coût J (θ, ϑ) possède les propriétés suivantes. En présence de données, l’état θ ˆ
test similaire à l’observation I
tà cause du premier terme de l’Eq.3. Sa régularité spatiale est contrainte par le second terme de l’Eq.3. L’évolution temporelle des états est contrainte par le modèle dynamique (Eq.1) à cause du premier terme de l’Eq.2.
En calcul des variations, une méthode standard pour ré- soudre des problèmes variationnels est le recourt aux équa- tions d’Euler-Lagrange. Par exemple, dans un cas statique l’état optimal θ ˆ pour le coût relatif aux observations E(θ) peut être trouvé comme la valeur stationnaire de l’équa- tion d’Euler-Lagrange ∂
tθ = −δ
θE où δ
θE est la différen- tielle du terme d’attache aux observations. Cependant, pour le problème variationnel de l’Eq.2, une utilisation directe des équations d’Euler-Lagrange se révèle inefficace du fait de la grande dimensionnalité de l’espace d’état. Comme proposé par [24], une méthode indirecte consiste à intro- duire les variables adjointes λ
t= Q
−1(∂
tθ + M (θ
t, ϑ
t)).
Avec ces variables, calculer les variations du coût dyna- mique de l’Eq.2 par rapport à la variable d’état, le champ de transport, et la valeur initiale, et faire usage de la pro- priété que les variations s’annulent pour les valeurs opti- males donnent le système d’équations :
δ
θtJ = −∂
tλ + δ
θM
∗(λ, ϑ) + δ
θE(θ
t) = 0 δ
θt0J = B
−1(θ
t0− θ
0) − λ
t0= 0
δ
ϑtJ = λ
t∇θ
t= 0
(4)
où δ
θM est la différentielle du modèle dynamique, et δ
θM
∗est l’opérateur adjoint. Suivant une procédure itérative, la solution du problème variationnel peut être linéarisé autour de valeurs initiales θ ˆ
tcomme suit :
θ
t= ˆ θ
t+ dθ
tθ ˆ
t0= θ
0(5)
Sachant par définition des variables adjointes que ∂
tθ + M (θ
t, ϑ
t) = Qλ
t, et en combinant la deuxième ligne de l’Eq.4 et l’Eq.5 donne :
dθ
t0= Bλ
t0∂
tdθ + δ
θM (dθ, ϑ) = Qλ
t(6)
Ainsi, les variations du coût peuvent être estimées de fa- çon itérative par une intégration rétrograde des variables adjointes prenant en compte le coût statique des observa- tions (première ligne de l’Eq.4), suivie par une intégra- tion avant des variations prenant en compte les valeurs des variables adjointes (seconde ligne de l’Eq.6) [25, 26, 27].
Etant donné les variations, les solutions peuvent être mises à jour. Le champ de transport peut être directement mis à jour par descente de gradient à l’aide de la troisième ligne de l’Eq.4. Les étapes de l’algorithme d’assimilation varia- tionnelle sont présentées dans la Fig.2.
3 Interpolation pour une série multi- modale
La Section 2 présente une méthode pour l’estimation de
données manquantes et de champs d’advection associés
étant donné une séquence d’observations d’une variable
géophysique. Cependant, en général, les variables géo-
physiques traitées ne sont pas indépendantes les unes des
autres. Le champ de transport sous jacent comprend des
structures de convergences et de divergences qui induisent
la formation de structures frontales dans des variables pas-
sives [28]. Ainsi, les variables étudiées (CHL, SST) pré-
sentent des structures géométriques similaires dans les ré-
gions frontales. Cette propriété peut être utilisée pour in-
1 : Partant de θ ˆ
t0= θ
0et ϑ ˆ
t= 0 réaliser une intégra- tion avant de ∂
tθ ˆ + M (ˆ θ, ϑ) = 0 ˆ
2 : Etant donné θ ˆ
tcalculer les variables adjointes λ
tà l’aide de l’intégration rétrograde :
λ
tf= 0
−∂
tλ + δ
θM
∗(ˆ λ, ϑ) = ˆ −δ
θE(ˆ θ
t) 3 : Calculer la valeur initiale des variations d θ ˆ
t0=
Bλ
t04 : Utiliser la variable adjointe λ
tpour calculer les va- riations dθ
tà partir d’une intégration avant partant de la valeur initiale dθ
t0:
∂
tdθ + δ
θM (dθ, ϑ) = ˆ Qλ
t5 : Mise à jour de l’état
θ ˆ
t= ˆ θ
t+ αdθ
tϑ ˆ
t= ˆ ϑ
t− αλ
t∇θ
t6 : Retourner à l’étape 2 et itérer jusqu’à convergence.
F IG . 2 – Algorithme d’assimilation variationelle de don- nées. α > 0 est un paramètre de descente de gradient.
troduire une contrainte de similarité géométrique addition- nelle entre les différentes variables. En termes de repré- sentation d’images, cette contrainte signifie que dans les différentes variables, les lignes de niveaux supportant les gradients de fortes magnitudes doivent être localement pa- rallèles. Dans la suite, nous donnons les détails à propos du coût qui comprend cette contrainte additionnelle.
Notons par I
t(i), t ∈ [t
0, t
f], i = 1, 2 les séries d’obser- vations avec données manquantes correspondant aux sé- quences de variables θ
t(i), t ∈ [t
0, t
f], i = 1, 2. Sans perte de généralités, nous supposons que θ
t(1)est de plus faible résolution spatiale et Λ est un opérateur linéaire de sous échantillonnage tel que Λθ
(2)tpossède la même dimension- nalité que θ
(1)t. Nous définissons le coût suivant :
E(θ
(1), θ
(2)) = E(θ
(1)) + E(θ
(2))...
−γ R
D(θ(1))
g
τ(|∇θ
(1)|)ρ (<
|∇θ∇θ(1)(1)|,
|∇Λθ∇Λθ(2)(2)|>)dp (7) où E(θ) est le terme d’attache aux données défini dans l’Eq.3, g
τ(x) = 1 − e
−τ xfor x > 0 est une fonction de pondération qui, pour x = |∇θ
(1)|, donne un poids plus fort aux pixels de θ
(1)où le gradient est fort, c’est à dire aux pixels appartenant aux structures frontales et donne un poids faible aux pixels où la magnitude du gradient est faible. Le paramètre τ > 0, de la fonction g
τ, fixe la ma- gnitude du gradient définissant les structures frontales. La fonction ρ
(s) = √
s
2+ , avec > 0, est une approxima- tion différentiable de la valeur absolue. γ > 0 pondère la
1 : Pour i = 1, 2, partant de θ ˆ
(i)t0
= θ
(i)0et ϑ ˆ
t= 0 effec- tuer les intégrations avant ∂
tθ ˆ
(1)+ M (ˆ θ
(1), Λ ˆ ϑ) = 0 et
∂
tθ ˆ
(2)+ M (ˆ θ
(2), ϑ) = 0 ˆ 2 : Etant donné θ ˆ
t(i), partant de λ
(i)tf
= 0, i = 1, 2, calcu- ler les variables adjointes λ
(i)ten utilisant les équations rétrogrades :
−∂
tλ
(1)+ δ
θ(1)M
∗(ˆ λ
(1), Λ ˆ ϑ) = −δ
θ(1)E(ˆ θ
(1)t, θ ˆ
(2)t)
−∂
tλ
(2)+ δ
θ(2)M
∗(ˆ λ
(2), ϑ) = ˆ −δ
θ(2)E (ˆ θ
t(1), θ ˆ
t(2)) 3 : Calculer le gradient aux états initiaux d θ ˆ
(i)t0
=
Bλ
(i)t0, i = 1, 2
4 : Pour i = 1, 2 utiliser les variables adjointes λ
(i)tpour calculer le gradient dθ
(i)tà partir d’une intégration ré- trograde partant des états initiaux du gradient dθ
(i)t0:
∂
tdθ
(1)+ δ
θ(1)M (dθ
(1), Λ ˆ ϑ) = Qλ
(1)t∂
tdθ
(2)+ δ
θ(2)M (dθ
(2), ϑ) = ˆ Qλ
(2)t5 : Mettre à jour les états
( θ ˆ
(i)t= ˆ θ
t(i)+ αdθ
(i)t, i = 1, 2 ϑ ˆ
t= ˆ ϑ
t− α
Λ
T(λ
(1)t∇θ
(1)t) + λ
(2)t∇θ
(2)t6 : Retourner à l’étape 2 et itérer jusqu’à convergence.
F IG . 3 – Algorithme pour l’estimation multimodale de données manquantes et de champs d’advection.
contribution du cout géométrique dans le terme d’attache aux observations E (θ
(1), θ
(2)). Les estimations θ ˆ
(1)et θ ˆ
(2)minimisant le coût E(θ
(1), θ
(2)) seront similaires aux ob- servations lorsqu’elles seront disponibles à cause des deux premiers termes de l’Eq.7. De plus, θ ˆ
(2)va présenter des structures frontales cohérentes aux structures frontales pré- sentes dans la variable θ ˆ
(1)à cause du terme d’à priori géo- métrique qui est minimisée lorsque les deux variables ont leur structures frontales alignées.
Le modèle d’observation couplé et le modèle dynamique d’advection-diffusion (Eq.1) peuvent être combinés pour construire le coût dynamique variationnel couplé
J (θ
(1), θ
(2), ϑ) = Z
tft0
||∂
tθ
(1)+ M (θ
(1), Λϑ)||
2Qdt... (8)
+ Z
tft0
||∂
tθ
(2)+ M (θ
(2), ϑ)||
2Qdt + ||θ
t(1)0