• Aucun résultat trouvé

Data-driven approaches for ocean remote sensing : from the non-negative decomposition of operators to the reconstruction of satellite-derived sea surface dynamics

N/A
N/A
Protected

Academic year: 2021

Partager "Data-driven approaches for ocean remote sensing : from the non-negative decomposition of operators to the reconstruction of satellite-derived sea surface dynamics"

Copied!
259
0
0

Texte intégral

(1)

HAL Id: tel-02083495

https://tel.archives-ouvertes.fr/tel-02083495

Submitted on 29 Mar 2019

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

the non-negative decomposition of operators to the reconstruction of satellite-derived sea surface dynamics

Manuel Lopez Radcenco

To cite this version:

Manuel Lopez Radcenco. Data-driven approaches for ocean remote sensing : from the non-negative decomposition of operators to the reconstruction of satellite-derived sea surface dynamics. Signal and Image processing. Ecole nationale supérieure Mines-Télécom Atlantique, 2018. English. �NNT : 2018IMTA0107�. �tel-02083495�

(2)

T HESE DE DOCTORAT DE

LÉCOLE NATIONALE SUPERIEURE MINES-TELECOM ATLANTIQUE

BRETAGNE PAYS DE LA LOIRE -IMTATLANTIQUE COMUE UNIVERSITE BRETAGNE LOIRE

ECOLE DOCTORALE N°601

Mathématiques et Sciences et Technologies de l'Information et de la Communication Spécialité : Signal, Image, Vision

Par

Manuel LOPEZ RADCENCO

Data-driven approaches for ocean remote sensing:

from the non-negative decomposition of operators to the reconstruction of satellite- derived sea surface dynamics

Thèse présentée et soutenue à IMT Atlantique Campus de Brest, le 12 décembre, 2018

Unité de recherche : Lab-STICC, Technopôle Brest-Iroise, CS 83818, 29238 Brest Cedex 3, France Thèse N° : 2018IMTA0107

Composition du Jury :

Président : Rapporteurs :

Professeur, Télécom ParisTech

Maître de Conférences, Université Savoie-Mont-Blanc Maître de Conférences, Université Grenoble-Alpes Maître de Conférences, Université de Bretagne-Sud Chercheuse, Institute Méditerranéen d'Etudes Avancés Professeur, IMT Atlantique

Professeur, IMT Atlantique Examinateurs :

Directeur de thèse : Co-directeur de thèse : Invités :

Florence TUPIN Abdouramanne ATTO Emmanuel COSME Anne CUZOL Ananda PASCUAL Ronan FABLET

Abdeldjalil AISSA EL BEY

Pierre AILLIOT Maître de conférences, Université de Bretagne Occidentale

(3)
(4)

Acknowledgements

A Lucía, por estar siempre conmigo y hacerme sentir que nunca estoy solo...

A mi familia y amigos, y particularmente a mi madre, por su apoyo incondicional y su cariño a la distancia...

Un grand remerciement à mes tuteurs, Prof. Ronan Fablet et Prof. Abdeldjalil Aissa-El-Bey, et à mon encadrant, Dr. Pierre Ailliot, pour le support, non seulement scientifique, mais aussi psychologique et moral, lors du déroulement de la thèse. Je remercie aussi les chercheurs de l’IMEDEA qui m’ont accueilli chaleureusement à Majorque, et plus particulièrement à Ananda Pascual et Laura Gomez Navarro. Merci également à Redouane Lguensat pour le template La- TeX. Je remercie Cédric Herzet pour son aide et sa bonne disposition. Finalement, merci aux rapporteurs et examinateurs pour avoir donné de son temps pour lire ce document et participer à ma soutenance de thèse.

Merci aux amis qui m’ont appuyé lors du déroulement de la thèse: Aurélien, Antony, Nicolas A., Steph, Thomas, Nicolas G., Alma, Sabrina, Redouane, Said, et d’autres que j’oublie proba- blement mais qui ne sont pas, néanmoins, moins importants.

On a personal note, besides acknowledging everyone that made this work possible, I would like to point out the deep feeling of personal and professional growth achieved during these last three years of research work. In particular, many fruitful interactions, not only with re- searchers directly involved in my daily research activities, but also with multiple researchers from a wide variety of scientific backgrounds (during conferences, symposiums and scientific visits) have helped me understand the need for scientific collaboration and the development of multidisciplinary research groups in order to ensure scientific advancement fully benefits from the interaction between different scientific disciplines. This would have not been possible with- out the help and support from PhD tutors and advisors, department colleagues and fellow PhD candidates.

(5)
(6)

Contents

Acknowledgments I

Résumé long en français VII

Abstract XXVII

Acronyms XXIX

Notation XXXIII

1 Introduction and thesis summary 1

1.1 Context . . . . 1

1.2 Geophysical motivations for data-driven approaches . . . . 3

1.3 Contributions . . . . 5

1.4 Dissertation outline. . . . 7

1.5 Publications and Valorization . . . . 7

1.5.1 International Conference papers . . . . 7

1.5.2 National Conference papers . . . . 8

1.5.3 Journal papers . . . . 8

1.5.4 Poster presentations . . . . 9

1.5.5 Invited talks . . . . 9

1.5.6 Other activities . . . . 9

I Non-negative decomposition of local operators 11 2 State of the art and related work 13 2.1 Introduction. . . . 13

2.2 Blind source separation . . . . 14

2.2.1 Proposed formulations . . . . 15

2.2.2 Associated numerical methods . . . 20

2.3 Operator decomposition . . . . 31

2.3.1 Orthogonality-based decompositions . . . 32

2.3.2 Dynamic mode decomposition. . . 37

(7)

2.3.3 Tikhonov-regularized decompositions . . . . 45

2.4 Conclusion . . . . 47

3 Proposed models and algorithms 49 3.1 Introduction. . . . 49

3.2 General model . . . . 50

3.3 Non-negative linear superposition of linear modes . . . . 51

3.3.1 Latent class model . . . 52

3.3.2 Parameter estimation . . . . 53

3.3.3 Alternating least squares algorithm. . . . 54

3.4 Reformulation based on local linear operators . . . . 58

3.4.1 Parameter Estimation . . . . 59

3.4.2 Dictionary-based decomposition of local linear operators . . . . 61

3.4.3 Model training and application . . . . 62

3.4.4 Computational complexity analysis . . . . 62

3.5 Conclusion . . . . 63

4 Algorithm evaluation and benchmarking 65 4.1 Introduction. . . . 65

4.2 Synthetic dataset generation. . . . 66

4.3 Estimation performance under ideal settings. . . . 67

4.4 Estimation performance with noisy mixing coefficients . . . . 72

4.5 Latent class initialization evaluation . . . . 78

4.6 Conclusion . . . . 82

5 Applications 85 5.1 Introduction. . . . 85

5.2 Data-driven forecasting of dynamical systems . . . . 86

5.3 Multi-tracer synergies for the characterization of upper ocean dynamics . . . . . 90

5.3.1 Segmentation of upper ocean dynamics from SST/SSS relationships in the Alboran Sea. . . 90

5.3.2 Segmentation of upper ocean dynamics from SST/SSH relationships in the Agulhas region . . . 92

5.4 Conclusion . . . 105

II Data-driven interpolation of sea level anomaly fields from satellite- derived ocean remote sensing data 107 6 Context and related work 109 6.1 Introduction. . . 109

(8)

Contents

6.2 Satellite altimetry . . . 111

6.2.1 Along-track nadir altimetry . . . 111

6.2.2 Surface Water Ocean Topography altimetry mission . . . 115

6.3 Geophysical field interpolation . . . 118

6.3.1 Exemplar-based methods . . . 119

6.3.2 Projection-based methods . . . 119

6.3.3 Data assimilation . . . 119

6.3.4 Analog Forecasting . . . 124

6.3.5 AnDA: The analog data assimilation framework . . . 125

6.4 Conclusion . . . 128

7 Locally-adapted convolutional models for the reconstruction of SLA fields from satellite along-track data 129 7.1 Introduction. . . 129

7.2 Model formulation . . . 131

7.2.1 Problem statement . . . 131

7.2.2 Unconstrained model calibration . . . 132

7.2.3 Dictionary-based decompositions . . . 133

7.2.4 Locally-adapted dictionary-based convolutional models. . . 134

7.2.5 Data and Methodology . . . 135

7.2.6 Results . . . 137

7.3 Conclusion . . . 138

8 Data-driven fusion of nadir along-track and SWOT data 141 8.1 Introduction. . . 142

8.2 Benchmarked methods . . . 144

8.3 Case study and data . . . 145

8.3.1 Data . . . 145

8.3.2 Observing System Simulation Experiment . . . 145

8.3.3 Pseudo-observations . . . 146

8.4 Method comparison and benchmarking . . . 146

8.5 AnDA Parameter Sensitivity Analysis . . . 148

8.5.1 Patch size . . . 149

8.5.2 Number of neighbours . . . 149

8.5.3 Assimilation lag . . . 150

8.5.4 Pseudo-observations half-window size . . . 150

8.6 AnDA Noise sensitivity analysis. . . 152

8.6.1 Nadir along-track data . . . 152

8.6.2 SWOT data . . . 153

8.7 Nadir along-track vs. SWOT data . . . 153

(9)

8.8 Altimetric data fusion . . . 158

8.9 Additional regressors for analog forecasting . . . 167

8.10 Assimilation of observation gradients . . . 170

8.11 Conclusion . . . 172

III Conclusion and Perspectives 175 9 Conclusion and Perspectives 177 9.1 Conclusions . . . 177

9.2 Perspectives . . . 179

9.3 Final thoughts . . . 181

List of Figures 194

List of Tables 197

Bibliography 220

(10)

Résumé long en français

Résumé

Mots clés : Télédétection satellitaire, Masses de données, Décomposition d’opérateurs, Non- négativité, Parcimonie, Dynamiques de l’océan, Fouille de données, Apprentissage statistique, Fusion de donnés multi-capteurs, Reconstruction haute-résolution, Interpolation.

Au cours des dernières années, la disponibilité toujours croissante de données de télédétection multi-source de l’océan a été un facteur clé pour améliorer notre compréhension des dynamiques de la surface de l’océan, de la circulation océanique et des interactions atmosphère-océan. A cet égard, il existe un potentiel largement sous-exploité dans les ensembles de données actuel- lement disponibles. Il est donc essentiel de mettre au point des approches efficaces pour mieux exploiter ces ensembles de données afin de résoudre, par des méthodes de fouille de données et d’apprentissage statistique, des problèmes tels que la fusion multi-capteurs, la reconstruc- tion haute résolution ou l’analyse multi-paramètres des processus d’intérêt. En particulier, la décomposition des processus géophysiques en modes pertinents est une question clé pour les pro- blèmes de caractérisation, de prédiction et de reconstruction. Inspirés par les progrès récents en séparation aveugle des sources issus de l’introduction de formulations non-négatives et parcimo- nieuses, nous visons, dans la première partie de cette thèse, à étendre les modèles de séparation aveugle de sources sous contraintes au problème de la caractérisation et décomposition d’opéra- teurs ou fonctions de transfert entre variables d’intérêt, en se concentrant sur des formulations non-négatives. Dans ce travail, nous développons des schémas computationnellement efficaces reposant sur des fondations mathématiques solides, y compris la reformulation du problème de décomposition d’opérateurs sous contraintes comme la décomposition par dictionnaire d’opéra- teurs linéaires estimés localement, pour améliorer ainsi la flexibilité du modèle. Nous illustrons la pertinence des modèles de décomposition proposés dans différentes applications impliquant l’analyse, la segmentation et la prédiction de dynamiques géophysiques. Par la suite, étant donné que la disponibilité toujours croissante d’ensembles de données multi-sources supporte l’explo- ration des approches pilotées par les données en tant qu’alternative aux formulations classiques basées sur des modèles, nous explorons, dans la deuxième partie de ce travail, des approches basées sur les données récemment introduits pour l’interpolation des champs géophysiques à partir d’observations satellitaires irrégulièrement échantillonnées. De plus, en vue de la future

(11)

mission SWOT, la première mission satellitaire à produire des observations d’altimétrie par sa- tellite complètement bidimensionnelles et à large fauchée, nous nous intéressons à évaluer dans quelle mesure les données SWOT, combinées ou non aux données altimétriques conventionnelles, permettraient une meilleure reconstruction des champs altimétriques.

Introduction

Au cours des dernières années, la télédétection satellitaire a produit une grande quantité de don- nées d’observation provenant d’une grande variété de sources. En effet, une vaste gamme de types de capteurs différents (imagerie multi et hyper-spectrale, imagerie SAR, imagerie micro-ondes, etc.) permet l’observation de différents paramètres géophysiques et géochimiques terrestres, océa- niques et atmosphériques (hauteur de la surface la mer, température de la surface de la mer, couverture végétale, développement urbain, etc.) à différentes résolutions spatio-temporelles, ce qui représente une énorme quantité de données très peu exploitées.

Une meilleure exploitation de ces ensembles de données nous permettrait d’améliorer la qualité, la puissance et la précision des modèles et des représentations des processus géophy- siques et géochimiques, ainsi que de dépasser les limites associées tant aux données actuellement disponibles, comme le fait qu’aucun capteur satellite ne permet de fournir des observations haute-résolution des dynamiques de l’océan à la fois temporellement et spatialement, qu’aux modèles et représentations actuels, trop complexes pour permettre une analyse efficace et une reconstruction haute résolution basée sur des observations, ou trop simples pour appréhender toute la variabilité spatio-temporelle des processus étudiés. Cependant, pour exploiter pleine- ment le potentiel de ces nouveaux ensembles de données, une compréhension approfondie de la relation entre les différentes variables impliquées est nécessaire.

À cet égard, la mise en œuvre de nouvelles approches pour exploiter pleinement le poten- tiel des ensembles de données actuellement disponibles apparaît clairement comme un enjeu de recherche majeur. En particulier, les approches d’exploration de données et d’apprentissage automatique pourraient être utilisées dans ce contexte pour une grande variété d’applications, allant de la fusion de données multi-sources et la reconstruction à haute résolution à l’analyse multi-paramétrique des processus géophysiques ou géochimiques, l’analyse spatio-temporelle et la segmentation de la dynamique des systèmes.

Dans ce contexte, cette thèse a deux objectifs majeurs :

1. Explorer les formulations non-négatives et parcimonieuses [69,155,200,233] pour dévelop- per de nouvelles méthodes non supervisées pour caractériser les relations entre variables à partir d’un ensemble représentatif d’observations. En effet, étant donné le succès récent des nouvelles formulations [69,155,200,233] pour s’attaquer aux problèmes de séparation

(12)

Résumé long en français

aveugle des sources [201], elles apparaissent comme une alternative intéressante pour ré- soudre le problème de la caractérisation des opérateurs à partir d’observations. Dans le contexte de la télédétection océanique, la disponibilité toujours croissante des observations motive davantage l’exploration d’approches pilotées par les données comme une alternative puissante aux schémas classiques basées sur des modèles.

2. Exploiter les méthodes et les formulations développées pour la résolution des problèmes inverses en télédétection océanique multi-sources/multi-paramètres, avec un accent parti- culier sur la reconstruction à haute résolution des champs des dynamiques de la surface de la mer à partir de données satellitaires. En particulier, nous exploiterons des nouveaux développements en altimétrie satellitaire produisant des observations satellitaires bidimen- sionnelles à large fauchée, dans le cadre de la future mission satellitaire SWOT [59,74,78].

Motivations géophysiques pour des approches pilotées par les données

Comme indiqué précédemment, la quantité de données de télédétection océanique multi-sources et de données in situ disponibles a connu une croissance considérable au cours des dernières décennies, ce qui a été un facteur clé pour des possibilités d’analyse plus approfondies menant à une meilleure compréhension des dynamiques de la surface de l’océan, de la circulation océanique et des interactions atmosphère-océan. En particulier, des efforts considérables ont été déployés pour comprendre les relations et les interactions entre les différentes quantités physiques océa- niques impliquées [4,33,97,114,160,227].

En ce qui concerne la télédétection par satellite, les missions satellitaires actuelles (et fu- tures) comportent généralement des observations partielles et irrégulièrement échantillonnées, ce qui est liée à la conception des orbites considérées, la géométrie des trajectoires des satellites, l’occlusion par des nuages, etc. De plus, les techniques d’interpolation utilisées actuellement ne parviennent pas à reconstruire avec précision les dynamiques de la surface de l’océan à plus petite échelle [34,68,73,74]. A cet égard, l’identification des limites des missions de télédétection satellitaires actuelles a conduit au développement de nombreuses améliorations des technologies de télédétection, telles que la future mission altimétrique SWOT. Il est important de noter que SWOT sera la première mission d’altimétrie satellitaire à exploiter l’interférométrie radar pour produire des observations altimétriques bidimensionnelles à large fauchée, par opposition aux altimètres conventionnels qui ne peuvent produire des mesures altimétriques que sur la trace nadir du satellite [59,74,78]. Ces développements motivent des efforts actuels qui se concentrent à la fois sur l’exploration de la synergie entre les différents traceurs dynamiques de l’océan pour améliorer la reconstruction des dynamiques de la surface de l’océan, et sur le développement de méthodes alternatives de reconstruction à haute résolution des dynamiques océaniques à partir d’observations satellitaires à échantillonnage irrégulier.

(13)

D’autre part, la hauteur de la surface de la mer (SSH) est, comme indiqué dans [244], une quantité intégrée en profondeur qui contient des informations sur la structure de densité de la colonne d’eau et que capture des structures à méso-échelle de 50 km à quelques centaines de kilomètres, ce qui signifie que les courants de surface peuvent être directement extraits à partir des champs de SSH en exploitant le balance géostrophique Au niveau des méso-échelles, ces cou- rants interagissent avec les champs de température de surface de la mer (SST) à grande échelle, ce qui implique que les dynamiques de la surface de l’océan forment un système complexe d’in- teractions qui varient sur une large gamme d’échelles, à la fois dans l’espace et dans le temps [244].

En outre, l’existence d’un mode dynamique de la surface de l’océan, appelé mode SQG (Quasi-Géostrophie de surface), caractérisé par une fonction de transfert linéaire entre la tem- pérature (SST) et la hauteur (SSH) de la surface de l’océan, a été démontrée dans des nombreux études théoriques et opérationnels [97,99,115,131,132,142,143,244].

En effet, des travaux récents soulignent que la dynamique de la surface de l’océan peut être caractérisée par des relations linéaires locales SST-SSH qui correspondent précisément à des opérateurs Laplaciens fractionnaires [97,115,132,142,143,244] qui peuvent être exprimés dans le domaine de Fourier comme :

FH(SSH) =d γ|k|FT(SST)d (1) k est le vecteur de longueur d’onde horizontale, FT etFH sont respectivement des filtres li- néaires de SST et SSH etγest un coefficient de normalisation [99,244]. La variation du paramètre α, qui contrôle le couplage effectif entre la SST et la SSH, conduit à différents modèles théo- riques classiques [244]. Pourα= 1/2, en particulière, on recourt au modèle quasi-géostrophique de surface [99,131,143,244].

Sous l’hypothèse SQG, deux conclusions principales peuvent être tirées de l’équation (1) : 1. Les courants de surface, donnés par les gradients orthogonaux de la SSH, peuvent alors

être calculés à partir des dérivés spatiales d’une version filtrée de la SST [114,244].

2. Une seule fonction de transfert linéaire ne suffise pas pour capturer complètement la grande complexité des dynamiques de la surface de l’océan. En effet, la relation SQG (1) suppose des conditions de mélange vertical spécifiques, qui ne sont pas forcement valables partout et à tout moment. [85,116,143]. De plus, lorsque la dynamique de la surface de l’océan est réellement déterminée par des dynamiques SQG, le paramètre γ peut varier à la fois dans l’espace et dans le temps [99,143,244], par exemple en fonction de la profondeur de la couche de mélange.

Ces résultats ont motivé le développement de nouvelles méthodes statistiques pilotées par les données pour combiner l’information disponible dans les observations de la SSH avec d’autres

(14)

Résumé long en français

données de télédétection, telles que la SST ou les données in situ [4,36,244,268]. Tandis que [85,116] ont étudié des couplages linéaires SSH-SST en exploitant des représentations dans le domaine de Fourier (domaine fréquentiel), Tandeo et al. [244] se sont appuyés sur le fait que, pour des échelles horizontales entre 50 km et quelques centaines de kilomètres, la turbulence de surface est compatible avec la théorie des turbulences géostrophiques, pour conclure que la dynamique de la surface de l’océan peut être prédite à partir des variations de la densité ho- rizontale en surface, possiblement dominées par des champs de SST. Ils ont exploité cette idée pour explorer les fonctions de transfert linéaires entre la SST et la SSH en introduisant une décomposition multimodale à l’aide d’un modèle de régression à classe latente, de sorte que les relations locales entre la SST et la SSH sont décrites par une fonction de transfert linéaire choisi parmi un nombre prédéfini de fonctions de transfert possibles.

Cependant, les résultats rapportés dans la littérature montrent qu’une seule fonction de transfert linéaire de type SQG ne suffit pas pour représenter avec précision toute les dynamiques de méso-échelle de la surface de l’océan dans une région donnée [244]. De plus, une limite importante des modèles de régression à classe latente est qu’ils ne peuvent tenir compte que d’un ensemble fini de fonctions de transfert linéaires. En revanche, le mode SQG est caractérisé par une seule classe de fonctions de transfert linéaires, à savoir l’opérateur Laplacien fractionnaireγ1/2, mais implique un paramètre scalaire positif γ [99,143,244], qui est liée à des caractéristiques géophysiques locales (par exemple, la profondeur de la couche de mélange). Par conséquent, les dynamiques de la surface de de l’océan de type SQG, caractérisées par un paramètre γ variant continuellement, peuvent ne pas être bien représentées par des modèles de régression à classe latente.

Contributions

Dans le contexte présenté ci-dessus, la nécessité de formulations plus complexes permettant de répondre aux limites des modèles actuels, ainsi que la réussite des modèles sous contraintes dans des applications de séparation aveugle de sources, nous ont amenés à explorer les développements récents dans ce domaine pour essayer de développer des modèles de décomposition plus efficaces.

Formellement, le problème de séparation aveugle de sources implique la décomposition d’un signal ou d’une image donné comme la superposition de différentes composantes :

y= XK k=1

αksk+ω (2)

y RI, le coefficient αk R quantifie la contribution de la composante sk RI, qui correspond au signal ou à l’image de référence k et ω RI est un processus de bruit blanc Gaussien avec une covariance Σ RI×I qui modélise l’erreur d’estimation. Le principe de la séparation aveugle de sources consiste alors à exploiter des observations des signaux ou des images ypour identifier et séparer les sources sk en quantifiant les coefficients de mélange αk,

(15)

de sorte que la reconstruction finale se rapproche du signal approximée y. À cet égard, des contraintes supplémentaires peuvent être considérées pour imposer des restrictions physiques ou structurelles à la décomposition afin d’améliorer l’identifiabilité et l’interprétabilité du modèle.

Ces dernières années, les contraintes de non-négativité et de parcimonie se sont révélées particu- lièrement intéressantes pour produire des décompositions plus pertinentes et plus interprétables.

Dans ce travail, nous visons à étendre les modèles de séparation aveugle des sources sous contraintes au problème de la caractérisation et décomposition d’opérateurs à partir des obser- vations :

yn= XK k=1

αnkfk(xn) +ωn (3)

xn RJ, yn RI, et nous visons à identifier αnk R, les coefficients de mélange qui modélisent la contribution de chaque mode à la reconstruction de yn pour un xn donné, et fk : RJ RI, une fonction, linéaire ou non-linéaire, associée au modek. ωn RI est un pro- cessus de bruit, généralement un bruit Gaussien additif, représentant l’incertitude du modèle.

Sur la base des progrès récents, nous nous concentrerons particulièrement sur des formulations linéaires sous contraintes de non-négativité ou parcimonie des coefficients de mélangeαnk. Même si cela dépasse le cadre de ce travail, nous soulignons qu’il est possible également d’envisager des contraintes supplémentaires sur les fonctions de transfert modales fk.

Il est à noter qu’en étendant les formulations de séparation aveugle de sources au problème de la décomposition d’opérateurs, nous suggérons que les modes dynamiques en jeu ne s’excluent pas les uns les autres, mais se superposent. Ceci est significativement différent de l’hypothèse de base faite par les modèles de régression à classe latente, comme dans [244], qui supposent qu’un seul mode est actif à un emplacement spatio-temporel donné. A notre connaissance, ceci est le première étude à montrer, à partir d’une analyse pilotée par les données, la superposi- tion continue de multiples modes dynamiques associés à différents types de fonction de transfert.

De plus, tandis que des travaux précédents se sont concentrés soit sur des couplages li- néaires spatialement homogènes [85,116], soit sur un ensemble fini de fonctions de transfert linéaires [244], nous allons considérer ici des représentations beaucoup plus riches, qui consi- dèrent toutes les possibilités de mélange parmi un ensemble fini de familles de relations linéaires.

Dans le contexte de l’océanographie physique, cette thèse s’ajoute à un corpus de travaux en cours, à la fois théoriques et pratiques, qui montrent que la dynamique à méso-échelle de la surface l’océan peut être caractérisée par un couplage linéaire local entre la SST et la SSH [97,115,132,142,143,244]. Nous soulignons de plus que des approches multimodales sont nécessaires, car une seule fonction de transfert linéaire ne suffit pas pour capturer complètement la variabilité spatio-temporelle, complexe et non-stationnaire, des dynamiques méso-échelle de la

(16)

Résumé long en français

surface de l’océan. Des travaux précédents ont plutôt exploré des fonctions de transfert moyennes régionales [85,116] ou des modèles de mélanges à classes latentes [244]. En ce qui concerne la télédétection par satellite, dans le cadre de cette thèse, nous poursuivons des efforts pour amé- liorer les méthodes d’interpolation actuelles [57] ou développer des approches alternatives pour la reconstruction à haute résolution des dynamiques de la surface de l’océan à partir des données satellitaires échantillonnées irrégulièrement [67,162,257]. Plus précisément, nous nous concen- trons sur l’exploitation des observations à large fauchée pour l’interpolation à haute résolution des champs d’anomalie de la hauteur de la surface de l’océan (SLA), dans la perspective de la future mission altimétrique SWOT.

Partie I : Décomposition non-négative d’opérateurs

Modèles et algorithmes

Comme nous l’avons indiqué précédemment, inspirés par le succès récent des approches de séparation de sources sous contraintes de non-négativité et parcimonie, nous visons à étendre les modèles de séparation sous contraintes à la caractérisation d’opérateurs à partir de données.

Dans ce travail, nous traitons ces questions et développons des schémas mathématiques solides et efficaces. Nos principales contributions sont :

Une formulation basée sur la méthode des moindres carrés dans l’espace d’observations, sous contrainte de non-négativité, ainsi que le développement de différents algorithmes d’estimation associées.

Une reformulation du problème considérée comme un problème d’apprentissage de dic- tionnaires, pour gagner en flexibilité de modélisation, y compris la possibilité d’envisager d’autres contraintes, tels que la parcimonie.

L’évaluation expérimentale des schémas numériques proposés, qui soulignent la pertinence du cadre d’apprentissage de dictionnaires.

Généralement, nous nous concentrerons sur les cas où des contraintes sont imposées soit sur les coefficients de décomposition, soit sur les modes de décomposition eux-mêmes. En particu- lier, nous introduisons un nouveau modèle de décomposition non-négative pour les opérateurs linéaires et étudions différents algorithmes d’estimation des paramètres, y compris une reformu- lation du modèle qui exploite les techniques d’apprentissage de dictionnaires. Plus particulière- ment, cette reformulation nous permettra d’obtenir une plus grande souplesse et la possibilité de modifier les contraintes du modèle de façon simple.

Modèle de superposition non-négative de modes linéaires

Prenons un ensemble de données d’observation à plusieurs variables{x,y}n, oùxnRJ,ynRI désigne lan-ème paire d’observations. Les variablesxnetynpeuvent, par exemple, faire référence

(17)

à des vecteurs, des patchs d’images pour différentes modalités ou des états successifs d’un système dynamique, en fonction du cas d’étude considéré. Nous nous concentrons sur le modèle (3) en supposant que la relation potentiellement non-linéaire entre xn et yn, donnée par la réponse fonctionnelle fk(xn), peut être approximée localement, avec une précision raisonnable, par un opérateur linéaire. Nous considérons la décomposition de l’opérateur linéaire fk(xn) reliant les variablesxn etynsous des contraintes de non-négativité. Cela se traduit par le modèle suivant :

yn= XK k=1

αnkβkxn+ωn

s.c.

αnk 0, kJ1, KK,nJ1, NK

||βk||F = 1, kJ1, KK

(4)

xn RJ, yn RI, αnk R+ sont des coefficients de mélange non-négatifs quantifiant la contribution du mode linéaire kà la reconstruction deynpour unxn donné,βkRI×J est une matrice de régression représentant le mode k,|| · ||F est la norme de Frobenius et ωn RI est un processus de bruit Gaussien centré avec matrice de covariance Σ, représentant à la fois les incertitudes du modèle et les erreurs d’observation.N etK indiquent respectivement le nombre total d’observations et de modes, alors que kJ1, KKetnJ1, NKindiquent respectivement le mode et observation actuelles.

Une contrainte de non-négativité a été imposée sur les coefficients de mélange αnk, ins- piré par le succès des décompositions non-négatives pour des applications dans lesquelles une superposition positive de différentes parties se produit naturellement [155]. La contrainte de non-négativité permet de distinguer la forme des relations linéaires entre les variables xn etyn de la magnitude de ces relations. De plus, une contrainte de normalisation sur les matrices de régression modales βk a été ajoutée pour éliminer les indéterminations d’échelle et améliorer l’identifiabilité du problème.

Le modèle (4) nous permet de résoudre des problèmes de décomposition impliquant des contributions linéaires mixtes et de généraliser les problèmes de mélange linéaires impliquant des régressions linéaires et les modèles de régression à classes latentes [47,244]. Par rapport aux modèles de l’état de l’art, tels que la régression classique et les modèles de régression à classes latentes [47,244], les principales caractéristiques de notre formulation proposée sont doubles : premièrement, elle tient compte des amplitudes possiblement variables des relations linéaires ; deuxièmement, elle évalue explicitement l’importance relative des différentes relations linéaires.

Cela présente un grand intérêt pour diverses applications telles que les tests d’hypothèses de régression, l’identification de fonction de transfert, etc.

(18)

Résumé long en français

Algorithmes

Nous énonçons l’estimation des paramètres du modèle (4) à partir d’un ensemble d’observations {x,y}n comme la solution d’un problème d’optimisation sous contraintes non-linéaire et non- convexe :

n,

hαˆnk,βˆki= arg min

αnkk

PN m=1Wmn

ym PK

k=1

αnβkxm

2

Σ

αnk 0, nJ1, NK,kJ1, KK

||βk||F = 1, kJ1, KK

(5)

|| · ||Σ est une norme pondérée selon la covariance Σ. Nous supposons que, selon les facteurs de pondération Wmn, plusieurs paires d’observation (xm,ym) peuvent partager des coefficients de mélange relativement similaires{αnk}. A cette égard, plusWmn est grand, plus les coefficients de mélange {αnk} et {αmk} sont similaires. La matrice de pondération W peut représenter à la fois des a priori de régularité espace-temps, de sorte que les paires d’observations proches dans l’espace et/ou le temps doivent partager des décompositions d’opérateurs similaires, ainsi que des a priori de similarité dans l’espace des variables, de sorte que les paires d’observations similaires partagent des décompositions similaires. Cela semble raisonnable pour des nombreuses applications où les paramètres devraient être corrélés et varier de façon continue dans le domaine spatio-temporel considéré. Le paramétrage de la matrice de pondération W devrait alors dé- pendre de l’application et peut être lié à des idées similaires utilisées dans la modélisation basée sur la covariance [16] et les schémas non-locaux [25,207]. Concernant les problèmes d’identi- fiabilité, si le nombre de modes K vérifie K > I, l’estimation des coefficients de mélange αnk devient impossible à partir d’une seule paire d’observations (xn,yn). A cette égard, la matrice de pondération W fournit également un moyen d’aborder l’estimation des paramètres de mélange dans de telles situations.

Algorithme des moindres carrés alternés

Approche par minimisation directe Compte tenu de la nature non-linéaire et non- convexe du problème de minimisation sous contraintes (5), l’estimation conjointe des paramètres de modèleαnketβkn’est pas simple. Heureusement, ce problème de minimisation conjointement non-convexe devient convexe lorsque l’estimation est effectuée pour un ensemble de paramètres uniquement, tout en considérant l’autre ensemble de paramètres comme fixe. Naturellement, cela suggère une approche de minimisation alternée, qui conduit aux mises à jour suivantes des ensembles de paramètres du modèleαnk etβk, itérées jusqu’à la convergence :

β-step :Minimisation surβk sous contraintes de normalisation avecαnk fixe.

α-step :Minimisation surαnk sous contraintes de non-négativité avec βk fixe.

(19)

Approche par descente de gradient L’inconvénient de la simplicité de l’approche de minimisation directe est qu’elle est sujette aux problèmes numériques. Comme indiqué dans la littérature sur la séparation aveugles des sources [10], les projections alternées sur les espaces de solutions non-contraintes et contraintes peuvent induire un comportement divergent ou numé- riquement instable. Pour traiter un tel problème, l’approche de minimisation directe peut être adoucie en considérant une descente de gradient. Ceci est ensuite combiné avec une projection sur l’espace des solutions non-négatives, ce qui revient à une méthode de gradient proximal [37].

Algorithme d’apprentissage de dictionnaires

Le problème de décomposition considéré peut être reformulé comme un problème d’appren- tissage de dictionnaires. Dans (4), l’opérateur linéaire PKk=1αnkβk peut être considéré comme la décomposition de l’opérateur linéaire local reliant les variablesyetxpour l’indexn. Cet opé- rateur linéaire local peut être estimé comme suit selon un critère des moindres carrées pondérés utilisant la matrice de pondération W :

Θn= XN m=1

WnmymxTm

! N X

m=1

WnmxmxTm

!1

(6) Wmn sont des coefficients de pondération qui rendent compte des contributions relatives des paires d’observations (xm,ym) à l’estimation de l’opérateur linéaire Θnassocié à la paire d’ob- servations (xn,yn). Cette estimation des moindres carrés revient à résoudre indépendamment le critère des moindres carrés pour chaque indexn dans (4).

A partir des opérateurs linéaires locaux {Θn}n, le problème (4) est lié à la décomposition non-négative de chaque opérateur linéaire Θn :

Θn= XK k=1

αnkβk+Υn

s.c.

αnk 0, kJ1, KK,nJ1, NK

||βk||F = 1, kJ1, KK

(7)

ou la nouvelle matrice d’erreur Υnest une matrice Gaussienne.

De plus, ce problème de décomposition sous contraintes peut être approximée comme un problème de décomposition basée sur l’apprentissage de dictionnaires :

hA,ˆ Bˆi= argmin

A,B ||ΦBA||2F

Akn0, kJ1, KK,nJ1, NK

||[B]:k||2 = 1, kJ1, KK

(8)

(20)

Résumé long en français

où la matrice Φ RIJ×N est obtenue en concaténant des opérateurs vectorisés θn = vec(Θn) (i.e. Φ= [θ1|...|θN]), les colonnes de la matrice ARK×N contient les coefficients de mélange αnk quantifiant la contribution de chaque mode kpour la reconstruction de l’opérateur linéaire local vectorisé θn et les colonnes deBRIJ×K (notées [B]:k) contiennent des versions vectori- sées des matrices de régression linéaire modales βk.

L’estimation des paramètres du modèle (8) revient, sous cette nouvelle formulation, à un problème classique d’apprentissage de dictionnaires couplé à une contrainte de non-négativité.

L’apprentissage de dictionnaires est un problème classique en traitement du signal, pour lequel de nombreuses méthodes, exploitant différentes contraintes, ont été proposées [3,10,13,155,156].

Ici, puisque nous considérons une contrainte de non-négativité, nous résolvons la minimisation (8) en utilisant une méthode de gradient proximal [37] pour tenir compte de la non-négativité de la matrice de coefficients de mélange A. Cela implique l’itération des deux étapes suivantes jusqu’à la convergence :

L’estimation par des moindres carrés de la matrice de dictionnaire.B sous des contraintes de normalisation.

L’estimation de la matrice de coefficients de mélangeAà l’aide d’une méthode de gradient proximal [37] pour appliquer la non-négativité.

Alternativement, on peut choisir une technique d’apprentissage de dictionnaires différente pour appliquer une contrainte différente (par exemple, KSVD [3] pour la parcimonie). Cela donne à la formulation basée sur l’apprentissage de dictionnaires une flexibilité et une adaptabilité accrues, étant donné que des contraintes de modèle alternatives peuvent ainsi être introduites de manière transparente dans le modèle (4).

Comparaison des algorithmes proposées

Nous avons évalué les performances des algorithmes présentés pour traiter le modèle de dé- composition général (4) dans des cas idéaux et non-idéaux. Nous considérons les algorithmes introduits précédemment, à savoir l’algorithme des moindres carrées alternes et la décomposi- tion d’opérateurs linéaires locaux par apprentissage de dictionnaires.

Nous étudions et comparons les algorithmes proposés en termes d’identification de para- mètres et de performances de reconstruction des observations dans divers environnements ex- périmentaux, notamment des environnements idéaux sans bruit, des cas impliquant un nombre variable de modes de décomposition et des configurations considérant des observations et des paramètres bruitées, afin de mieux comprendre la robustesse et les limites des algorithmes pro- posés. Nous discutons ensuite de l’apport principal de notre approche par rapport aux méthodes de l’état de l’art pour l’analyse et la décomposition d’opérateurs.

(21)

Nous rapportons des expériences numériques pour évaluer les modèles et les algorithmes proposés. Nous exploitons des données synthétiques pour effectuer une analyse quantitative de la performance d’estimation et une analyse de sensibilité par rapport à des paramètres clés et des hypothèses de modélisation.

Globalement, la décomposition par dictionnaire des opérateurs linéaires locaux semble offrir les meilleures performances en termes d’identification du modèle, de stabilité et de complexité de calcul dans des conditions favorables. Alternativement, dans des configurations non-idéales, des algorithmes moins stables, tels que l’algorithme des moindres carrées alternes, peuvent néan- moins s’avérer utiles pour l’identification du modèle et la reconstruction des observations.

À cet égard, les résultats rapportés suggèrent la nécessité de considérer des contraintes et/ou des a priori de régularisation supplémentaires pour résoudre les problèmes d’identifiabilité du modèle (4) dans des configurations non-idéales. En effet, même si nos expériences suggèrent que le modèle et les algorithmes proposés offrent de bonnes performances de reconstruction dans la plupart des configurations considérés, ce qui les rend adaptés à la plupart des problèmes de reconstruction/prédiction, l’identification du modèle semble être considérablement sensible aux configurations non-idéales, où l’hypothèse de partage des paramètres est assouplie ou lorsque le nombre ou la sélection d’observations auxiliaires pour l’estimation des paramètres induit des erreurs. Les résultats suggèrent également que l’identifiabilité du modèle peut être améliorée en introduisant des approches d’estimation robustes pour les opérateurs linéaires locaux et/ou des contraintes de modèle supplémentaires.

Cependant, les modèles et algorithmes proposés ont été utilisés avec succès dans des applica- tions de reconstruction/prédiction et de segmentation [165,166,169]. Ces applications soulignent la pertinence de la décomposition non-négative proposée par rapport aux méthodes basés sur l’orthogonalité ou les régressions à classe latente, qui sont considérés dans la plupart des travaux précédents [85,90,116,244].

Applications

Dans ce travail, nous présentons aussi l’application des algorithmes proposés à plusieurs pro- blèmes impliquant à la fois la segmentation et la reconstruction/prédiction. Nous décrivons les avantages des formulations proposées par rapport à des modèles classiques pour une série de problèmes inverses en océanographie physique et en géosciences. En particulier, nous nous concentrons sur la caractérisation des dynamiques de la surface de l’océan à partir de différents traceurs satellitaires océaniques (SST, SSH, SSS), ainsi que sur des problèmes de reconstruc- tion/prédiction des systèmes dynamiques.

Références

Documents relatifs

As a first step, to improve comprehension of population exposure to levels of traffic related air pollution in the vicinity of roads, the review focuses on local scale in studying

Here we compare outlines for clean and debris- covered glaciers, as derived from single and multiple digitizing by different or the same analysts on very high- (1 m)

Realistic molecular dynamics simulations of polyaminocarboxylate complexes of gadolinium (III) ion in water are performed, providing coordination numbers and average

First, including all main fixed effects (cross and food for the response variables reproductive investment, larval survival, development time, and cross, food, and sex for body

In feeding situations, group reared animais showed no signs of agonistic behaviour between individuals during the first 4 months, but there must be some kind

This may lead to the large shrinkages that were observed if enough spaces have been formed by ionic diffu- sion; if some of the spaces are too large,

Note that the differential priming effect observed between the whispered voiceless (/petal/) and voiced (/pedal/) prime words in the congruent conditions cannot

We developed an application of the Analog Data Assimilation (AnDA) to the reconstruction of SLA fields in the Western Mediterranean Sea from satellite altimetry data, namely