• Aucun résultat trouvé

5.3 Séparation de source en aveugle

5.3.2 Mélange linéaire et décorrélation

Les parties suivantes concernent la séparation de source en aveugle en se basant sur des méthodes statistiques. Chaque titre de chapitre explicite les hypothèses statistiques faites sur les sources.

5.3.2.1 Décorrélation et mélange linéaire

Cette sous-section porte sur la séparation de sources en effectuant deux hypothèses : les sources sont en mélange linéaires et les sources sont décorrélées entre elles. C’est à dire qu’elles ont une covariance nulle. L’Analyse en Composante Principale (ACP) réalise cette séparation de source non supervisée puisque les nouvelles variables aléatoires sont décorrélées, comme souligné dans le chapitre de l’ACP concernant la réduction de dimensionnalité (voir chapitre 2.4.2 page 47). Le problème de séparation de source linéaire s’écrit :

S(λ ) =

Ns

i=1

Ai(λ ).Pi+ ε(λ ) (5.6)

En écriture matricielle pour tout le cube hyperspectral, cette relation devient :

Cλ ,z= Aλ ,i.Pi,z+ ελ ,z (5.7)

En comparant ces équations avec les équations du mélange linéaire en séparation de source

supervi-sée (équation 5.4 et 5.5), il apparaît que : Si(λ ) = Ai(λ ) et αi= Pi. En notation matricielle : Sλ ,i= Aλ ,i

et αi,z= Pi,z.

Deux descriptions, utilisant deux type de vocabulaires différents, sont possibles. D’une part, la com-munauté des planétologues utilise les termes suivants : “signature spectrale” et “composantes”. Les signa-tures spectrales sont des spectres. Les spectres observées forment un mélange de signasigna-tures spectrales, à proportion des composantes qui sont des images. Ce vocabulaire est attaché à la dimensionnalité (spa-tiale ou spectrale).

D’autre part, la communauté des statisticiens utilisent les termes suivants : “source” et “matrice de mé-lange”. Les sources sont des variables aléatoires (dans la dimension spectrale ou spatiale !). Les signaux observées (dans la dimension spectrale ou spatiale !) sont issus d’un mélange de sources en proportion d’une ligne de la matrice de mélange (dans la dimension spectrale ou spatiale !).

Afin de réduire les ambiguïtés, considérons le “mélange spatial” : il faut absolument noter que le

vecteur de la “matrice de mélange” correspondant à la source “i”, noté Ai(λ ), est un spectre. On parle

parfois aussi d’“axe” portant la source “i”. Le “coefficient de mélange” ou “proportion de mélange” de

spectreassocié à la source “i”, du terme Piqui est l’occurrence de la source “i”. Ces termes et leurs noms associés sont usuels dans la littérature de la séparation de source et des mélanges supervisés, j’ai choisi de les conserver pour cette thèse. L’expression “mélange spatial” est ambiguë car la matrice de mélange est constituée de spectres et les sources sont des proportions de surfaces. Nous allons donc éliminer cette terminologie. De la même manière, le problème transposé dit de “mélange spectral” (voir ci-après) porte à confusion.

En identifiant chacun des termes de la séparation de sources à l’équation linéaire de la réflectance 5.1 exprimée en facteur de radiance, on obtient les relations suivantes :

Ai(λ ) = Φ(λ ).Ri(λ ) (5.8)

Pi= αi. cos(θi) (5.9)

B(λ ) = B(λ ) (5.10)

L’identification sur l’équation exprimée en facteur de réflectance (voir équation 5.3) est similaire à

celle-ci, en utilisant le facteur cos(θi) = 1.

En introduisant une renormalisation des sources, il est possible d’éliminer le facteur cos(θi) pour des

données en facteur de radiance :

Pi0= PiNi=1s Pi = αi. cos(θi)Ni=1s αi. cos(θi) = αiNi=1s αi = αi0 (5.11)

L’équation 5.6 s’écrit alors :

S(λ ) =

Ns

i=1

Ai(λ ).Pi0+ B(λ ) (5.12)

Cette équation est valable uniquement si les hypothèses ML sont toutes valides (voir section 5.1).

5.3.2.2 Décorrélation spatiale ou spectrale

Les données sont organisées sous forme de matrice Cz,λ dans laquelle les dimensionnalités spatiales

ont été aplaties. Le nombre de pixels total est Nz. Le nombre de spectels total est Nλ. Il est possible

d’ap-pliquer une ACP de deux manières différentes suivant l’hypothèse de décorrélation spatiale ou spectrale. Les deux problèmes, liés par une simple transposition, ne sont pas équivalents. Le tableau 5.1 compare les propriétés des deux approches.

– “Décorrélation spatiale” : La décorrélation spatiale est l’hypothèse sous-jacente à l’identification précédente (voir équations 5.8, 5.9 et 5.10). L’approche spectroscopique classique, telle que pré-sentée au chapitre 2.4.2 page 47, considère une décorrélation spatiale. Cette approche est liée à l’écriture de la réflectance en mélange linéaire, présentée au chapitre 5.1 page 92, supposant un mélange entre spectres. C’est un problème bien contraint car, dans le cas des images

hyperspec-trales, le nombre de sources est en général bien inférieur à la dimension spectrale Nλ. De plus,

l’évaluation statistique est bien posée, car le nombre Nzd’occurrence des variables aléatoires de

travail est très grand (de l’ordre de la centaine de milliers). Enfin, le bruit est correctement modélisé

par cette approche puisque le nombre d’occurrences du bruit est la dimension spatiale Nz.

Néan-moins, l’hypothèse statistique de décorrélation spatiale des sources n’est pas valide car la somme des occurrences des sources égale à un quand elles sont interprétées comme des proportions de surface.

– “Décorrélation spectrale” : Dans l’identification précédente, il suffirait d’échanger les termes

Ai(λ ) en Pi(λ ) et Pi en Ai pour obtenir un mélange qui sous-tend la décorrélation spectrale. La

décorrélation spectrale est une hypothèse correcte si les corps purs en présence ont des spectres décorrélés, ce qui semble valable d’un point de vue spectroscopique. Cependant, certains portions de spectres peuvent parfois être corrélées. Par exemple, certaines liaisons chimiques, comme la

TAB. 5.1 – Comparaison entre l’ACP spatiale et l’ACP spectrale

Méthode décorrélation spectrale décorrélation spatiale

Matrice de données Cz,λ ∼ Az,i.Pi,λ CTλ ,z∼ Aλ ,i.Pi,z

Dimension des signaux Nz∼ 100000 Nλ ∼ 200

Nombre d’occurrences de signaux Nλ ∼ 200 Nz∼ 100000

Matrice de mélange Az,i Aλ ,i

Nombre de sources Np∼ 5 Np∼ 5

Nombre d’éléments Nz.Np∼ 500000 Nλ.Np∼ 1000

Matrice des sources Pi,λ Pi,z

Nombre d’occurrences Nλ ∼ 200 Nz∼ 100000

Matrice de bruit Bj,λ Bj,z

Dimensionnalité d’occurrence spectrale spatiale

Nombre d’occurrences Nλ ∼ 200 Nz∼ 100000

Estimation statistique mauvaise bonne

Hypothèse statistique de décorrélation moyenne mauvaise

liaison O-H qui forme la bande à 3 microns, sont présentes dans de nombreux matériaux martiens. L’hypothèse de décorrélation spectrale est donc mise à mal. De plus, elle est associée à un pro-blème sous-contraint. Enfin, le bruit est mal modélisé puisque le nombre d’occurrences est égal à la dimension spectrale, c’est à dire de l’ordre de la centaine seulement.

En conclusion, l’ACP en décorrélation spatiale est la plus utilisée, car la robustesse semble être le critère essentiel.

5.3.2.3 Indétermination d’ordre et de signe

L’ACP permet d’estimer des sources mais, deux indéterminations majeures, intrinsèques à la mé-thode, persistent :

Indétermination d’ordre : on peut échanger l’ordre des sources sans changer le résultat tant que la

somme ∑Ns

i=1Ai.Pireste inchangée.

Indétermination de signe : il est toujours possible de multiplier la source par -1 et de multiplier

la matrice de mélange aussi par -1 sans changer le résultat de la somme ∑Ns

i=1Ai.Pi, ni la variance, ni la covariance (qui est nulle). Les sources sont donc définies à un signe près.

5.3.2.4 Résultat sur des données réelles

Montrons maintenant que l’ACP en décorrélation spatiale ne produit pas de résultat interprétable en terme de propriétés de surface. Appliquons cette méthode sur des données en réflectance d’une ob-servation particulière d’OMEGA de la calotte permanente sud de Mars (ORB0030_0, ORB0041_1 et ORB0061_1), nettoyée des spectels pollués par du bruit. Les trois premières lignes de la matrice de mé-lange, associée aux trois sources de variances les plus élevées, ont été représentées sur la figure 5.1. Bien que ces axes soient assez stables d’une image à une autre, il est impossible de les interpréter comme des spectres sources physiques, notamment à cause de la possible négativité. Il est par ailleurs impossible de les associer à un phénomène photométrique ou instrumental particulier.

L’application de l’ACP pour la séparation de source sur des données OMEGA a été développée au cours de mon stage de Master 2 (261) et prolongé au cours de cette thèse.

L’hypothèse de décorrélation des sources a une signification géométrique : les axes portant les sources doivent être orthogonaux. En reprenant, l’étude de Douté et al. sur la calotte permanente sud (64), présentée au chapitre 3.1.1 page 61, il est possible de tracer grossièrement, dans le sous espace des deux premières composantes ACP, un diagramme triangulaire dont les sommets expriment les sources

(a) ACP Axe 1

(b) ACP Axe 2

(c) ACP Axe 3

FIG. 5.1 – Matrice de mélange associée aux sources de variance la plus élevée (Axe 1), la seconde plus

grande (Axe 2) et la troisième (Axe 3). Trois observations de la calotte permanente sud sont mises en correspondances (noir : ORB0030_0 / rouge : ORB0041_1 / bleu : ORB0061_1). Parfois ces axes ont été multipliés par -1.

FIG. 5.2 – Classification manuelle spectrale utilisant la MNF par Douté et al. (64) (voir figure 3.1 page 62). Les endmembers sont les spectres correspondants aux points les plus proches des pôles de

poussière (dust - rouge), d’eau (bleu) et de CO2(vert). Les axes de couleurs superposés à la classification

représentent les trois axes supposés de poussière (rouge), d’eau (bleu) et de CO2 (vert). Ces axes sont

non-orthogonaux.

de glace d’eau, glace de CO2et poussière (voir figure 5.2).

Les côtés du triangle sont non-orthogonaux entre-eux, donc l’hypothèse de décorrélation entre ces trois sources potentielles ne semble donc pas correcte. Néanmoins, il est tout de même possible que ces axes soient orthogonaux, dans un sous espace plus grand que celui des deux premières composantes de l’ACP. La méthode supervisée Wavanglet développée au cours de cette thèse (voir annexes 13 page 219 et 4.1.1 page 78) et appliquée à l’observation ORB0041_1, permet de tester l’hypothèse de décorréla-tion des sources dans le domaine spatial ou spectral. Il suffit de mesurer la corréladécorréla-tion des masques de détection et des spectres de références, pour tester cette hypothèse.

Corrélations spatiales des masques de détection :

Cspatial(poussiere, CO2, H2O) =   1 −0, 61 −0, 24 −0, 61 1 −0, 25 −0, 24 −0, 25 1   (5.13)

Corrélations spectrales des spectres de références (voir annexe 4.1.1 page 78) :

Cspectral(poussiere, CO2, H2O) =   1 0, 15 0, 31 0, 15 1 0, 73 0, 31 0, 73 1   (5.14)

Dans le domaine spatial, il existe une très forte anti-corrélation entre la présence de glace de CO2et de

poussière. L’explication la plus simple consiste à prétendre que la glace de CO2masque complètement le

substrat minéral. Dans une autre mesure, la poussière étant spectralement neutre, il peut y avoir un biais de détection de l’algorithme de détection Wavanglet, détectant uniquement les formes spectrales. Dans

le domaine spectral, les glaces d’eau et de CO2 à l’échantillonnage spectral d’OMEGA présentent une

très forte corrélation. Cette corrélation est fortuite, elle devrait disparaître si la fenêtre spectrale grandit ou l’échantillonnage augmente.