Séparation bayésienne de sources spectrales sous contraintes de positivité et d'additivité

(1)

HAL Id: hal-00455608

https://hal.archives-ouvertes.fr/hal-00455608

Submitted on 14 Feb 2010

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Séparation bayésienne de sources spectrales sous contraintes de positivité et d’additivité

Nicolas Dobigeon, Saïd Moussaoui, Jean-Yves Tourneret

To cite this version:

Nicolas Dobigeon, Saïd Moussaoui, Jean-Yves Tourneret. Séparation bayésienne de sources spectrales

sous contraintes de positivité et d’additivité. XXIième Colloque GRETSI sur le Traitement du Signal

et des Images, Sep 2007, Troyes, France. pp.CDROM. �hal-00455608�

(2)

S´ eparation bay´ esienne de sources spectrales sous contraintes de positivit´ e et d’additivit´ e

Nicolas Dobigeon ¹ , Sa¨ıd Moussaoui ² , Jean-Yves Tourneret ¹

1 IRIT/ENSEEIHT/T´eSA

2 rue Charles Camichel, BP 7122, 31071 Toulouse cedex 7, France

2 IRCCyN – CNRS UMR 6597

1 rue de la No¨e, BP 92101, 44321 Nantes Cedex 3, France

{Nicolas.Dobigeon, Jean-Yves.Tourneret}@enseeiht.fr, Said.Moussaoui@irccyn.ec-nantes.fr

R´ esum´ e – Cet article décrit une méthode d’analyse de mélanges de sources spectrales lorsque des contraintes d’additivité et de positivité sont imposées sur les coefficients du mélange. Nous définissons un modèle bayésien hiérarchique permettant de traduire ces contraintes qui sont alors prises en compte par méthode d’estimation bayésienne couplée à un échantillonneur de Gibbs.

L’algorithme résultant est illustré sur un mélange synthétique.

Abstract – This paper addresses the problem of spectral unmixing under positivity and additivity constraints for the mixing coefficients. A hierarchical Bayesian model is introduced to satisfy these positivity and additivity constraints. A Gibbs sampler is then studied to simulate samples distributed according to the posterior of the unknown parameters associated to this Bayesian model. Simulation results conducted with synthetic data illustrate the performance of the proposed algorithm.

1 Introduction

Nous considérons dans cet article un problème de sépa- ration de sources spectrales qui est rencontré en :

1. chimie analytique o` u le spectre d’absorbance d’une substance multicomposantes est d’après la loi de Beer- Lambert un mélange linéaire des signatures spectrales des composantes pondéré par les concentrations de ces composantes ;

2. imagerie hyperspectrale o` u le spectre de réflectance issu d’un pixel de l’image est interprété comme un mélange linéaire des réflectances de différents consti- tuants de la zone géographique correspondant à ce pixel. La pondération de chaque spectre dans le mé- lange correspond à l’abondance du constituant.

Ainsi, sous hypothèse de linéarité du mélange, le modèle d’observation s’écrit :

y i,j = X M

m=1

c i,m s m,j + e i,j , (1) o` u y i,j est le spectre du mélange observé à l’instant i (i = 1, . . . , N ) dans la j î` ême bande spectrale (j = 1, . . . , L), N est la taille de l’échantillon, M est le nombre de composants dans la substance observée et L est le nombre de longueurs d’onde (ou le nombre de bandes spectrales). Le coefficient c i,m est la contribution du m î` ême composant chimique à l’instant i et e _i,j est un bruit additif modéli- sant les erreurs de mesure et du modèle. Les séquences de bruit e i = [e i,1 , . . . , e i,L ]

^T

sont supposées indépendantes, identiquement distribuées (i.i.d.) suivant une loi normale centrée de variance σ ² _e,i . Des notations matricielles stan- dard permettent d’écrire pour les N observations dans les

L bandes spectrales :

Y = CS + E, (2)

o` u Y = [y i,j ] _i,j ∈ R ^N×L , C = [c i,m ] _i,m ∈ R ^N×M , S = [s m,j ] _m,j ∈ R ^M

^×L

et E = [e i,j ] _i,j ∈ R ^N×L . En vertu de consid´erations physiques ´evidentes, les vecteurs de concentrations c i = [c i,1 , . . . , c i,M ]

^T

et les spectres s m = [s m,1 , . . . ,

s m,L ]

^T

, pour m = 1, . . . , M , doivent vérifier des contraintes de positivité. De plus, certaines analyses comme les ci- nétiques chimiques [1] nécessitent que les coefficients de concentration [c i,1 , . . . , c i,M ] soient soumis également à des contraintes d’additivité. Le problème de démixage spectral

étudié dans cet article consiste donc à estimer conjointe- ment la matrice des concentrations C et la matrice des spectres S sous les contraintes de positivité et d’additivité suivantes :

½ s m,j > 0 et c i,m > 0, ∀(i, m, j), P _M

m=1 c i,m = 1 ∀i. (3)

Dans [2], une méthode d’inférence bayésienne est propo- sée pour réaliser la séparation de sources sous la contrainte de positivité des sources et des coefficients de mélange.

Nous présentons dans ce papier, une méthode permettant d’inclure également la contrainte d’additivité dans le mo- dèle bayésien, en proposant une loi a priori adéquate. De plus, la prise en compte de cette contrainte d’additivité va permettre de lever l’indétermination d’échelle (point

´evoqu´e dans [3]).

(3)

2 Mod` ele bay´ esien hi´ erarchique

2.1 Fonction de vraisemblance

Les propriétés statistiques du vecteur de bruit e i ainsi que le modèle de mélange linéaire (1) nous permettent d’écrire y i ∼ N ¡

S

^T

c i , σ ² _e,i I L

¢ , avec y i = [y i,1 , . . . , y i,L ]

^T

, o` u N (·, ·) représente la loi normale et I L est la matrice identité de taille L×L. En supposant l’indépendance entre les vecteurs e 1 , . . . , e N , la vraisemblance des observations Y est :

f ¡

Y|C, S, σ ² _e ¢

∝ 1

Q _N

i=1 σ ^L _e,i exp

" _N X

i=1

−

° ° y i − Sc

^T

_i °

° ² 2σ _e,i ²

# , (4) o` u σ ² _e = £

σ _e,1 ² , . . . , σ ² _e,N ¤

_T

, kxk ² = x

^T

x est la norme L ² et

∝ signifie “proportionnel `a”.

2.2 Lois a priori des param` etres

2.2.1 Coefficients de concentration

En utilisant les contraintes d’additivité introduites dans (3), les vecteurs de régression peuvent être décomposés sous la forme c i = £

a

^T

_i , c i,M

¤

_T

avec a

^T

_i = [c i,1 , . . . , c i,M

−1

] et c i,M = 1 − P _M

₋₁

m=1 c i,m . La loi a priori naturelle pour les vecteurs a i , i = 1, . . . , N , est une loi uniforme sur le simplex suivant ¹ :

S = (

a i

¯ ¯

¯ a i,m ≥ 0, ∀m = 1, . . . , M − 1,

M−1 X

m=1

a i,m ≤ 1 )

. (5) En supposant l’ind´ependance a priori entre les vecteurs a i , la loi a priori pour la matrice d’abondance A = [a 1 , . . . , a N ]

^T

s’´ecrit f (A) = Q _N

i=1 1

S

(a i ), o` u 1

S

(·) est la fonction indi- catrice d´efinie sur le simplex S.

2.2.2 Spectres des sources

Plusieurs lois à support positif peuvent être envisagées comme lois a priori du spectre de chaque source. Pour des raisons de simplifications calculatoires, il apparaˆıt tout de même judicieux de choisir une loi qui soit conjuguée.

Comme nous le verrons au paragraphe 3, il est en ef- fet int´eressant que la loi conditionnelle f ¡

S|σ ² _s , A, σ ² _e , Y ¢ soit simple à simuler. Nous nous limiterons dans les para- graphes 2.4 et 3 à décrire un modèle basé sur une loi normale tronquée. En revanche, au paragraphe 4, nous com- parerons des résultats de démélange aveugle obtenus grâce

à ce modèle et des résultats obtenus lorsqu’une loi exponentielle est choisie comme loi a priori pour les sources.

Une loi normale tronqu´ee `a support positif est donc choisie comme loi a priori pour chaque source s m :

s m

¯ ¯ σ ² _s,m ∼ N ⁺ (0 L , σ _s,m ² I L ), (6) o` u 0 L est le vecteur de L zéros et N ⁺ (u, V ) est une loi normale tronquée positive de vecteur moyenne u et de matrice de covariance V . La densité de probabilité de cette loi

1

Nous remarquons que ce choix est ´equivalent ` a choisir des lois de Dirichlet D

M

(1, . . . , 1) comme lois a priori pour c

i

(i = 1, . . . , N ).

multivariée tronquée notée φ + (·|θ, Σ) vérifie la relation : φ ⁺ (x|θ, Σ) ∝ φ(x|θ, Σ)1

_RL

+

(x), (7)

o` u φ(·|θ, Σ) est la densité de probabilité de la loi normale multivariée usuelle sur R ^L de vecteur moyenne θ et de matrice de covariance Σ. En supposant l’indépendance entre les spectres s m (m = 1, . . . , M ), la loi a priori de S s’écrit :

f ¡ S ¯

¯ σ ² _s ¢

= Y M

m=1

φ ⁺ (s m |0 L , σ _s,m ² I L ), (8) avec σ ² _s = £

σ _s,1 ² , . . . , σ ² _s,M ¤

_T

. 2.2.3 Variance du bruit

Des lois a priori conjugu´ees inverse Gamma sont choi- sies pour σ ² _e,i :

σ ² _e,i | ρ _e , ψ _e ∼ IG µ ρ e

2 , ψ e

2 ¶

, (9)

o` u IG ³

ρ

e

2 , ^ψ ₂

^e

´

d´esigne la loi inverse Gamma de para- m`etres ^ρ ₂

^e

et ^ψ ₂

^e

. En supposant l’ind´ependance entre les variances du bruit σ _e,i ² , i = 1, . . . , N , la loi a priori de σ ² _e s’´ecrit :

f ¡

σ ² _e |ρ _e , ψ _e ¢

= Y N

i=1

f ¡

σ _e,i ² |ρ _e , ψ _e ¢

. (10)

L’hyperparamètre ρ e est fixé à ρ e = 2 tandis que ψ e est un hyperparamètre ajustable comme dans [4].

2.3 Lois a priori des hyperparam` etres

Une loi conjuguée inverse Gamma est choisie comme loi a priori pour chaque variance σ _s,m ² . En supposant l’indé- pendance a priori entre les différentes variances, la loi a priori de l’hyperparamètre σ ² _s s’écrit :

f ¡

σ ² _s |ρ s , ψ s

¢ = Y M

m=1

IG µ

σ ² _s,m ; ρ s

2 , ψ s

2 ¶

. (11)

Les paramètres ρ s et ψ s sont fixés de manière à obtenir une loi a priori non informative.

La loi a priori de ψ e est une loi non-informative de Jeffrey qui traduit l’absence de connaissance concernant cet hyperparam`etre :

f (ψ e ) = 1

ψ e 1

_R⁺

(ψ e ). (12)

L’indépendance entre les différents hyperparamètres permet d’exprimer la loi a priori du vecteur d’hyperpara- mètres Φ = ©

σ ² _s , ψ e

ª :

f (Φ) ∝ Y M

m=1

· 1 σ ^ρ s,m

^s

⁺²

exp µ

− ψ s

2σ _s,m ²

¶¸ 1

ψ e 1

_R⁺

(ψ e ). (13)

2.4 Loi a posteriori de Θ

La loi a posteriori du vecteur de param`etres inconnus Θ = ©

A, S, σ ² _e ª

peut être calculée à partir de la structure hiérarchique suivante :

f (Θ|Y) ∝ Z

f (Y|Θ) f (Θ|Φ) f (Φ) dΦ, (14)

(4)

o` u f ¡ Y ¯

¯ Θ ¢

et f (Φ) ont été définies dans (4) et (13). De plus, en supposant l’indépendance entre A, S et σ ² _e , le résultat suivant peut-être obtenu :

f ¡ Θ ¯

¯ Φ ¢

= f (A) f ¡ S ¯

¯ σ ² _s ¢ f ¡

σ ² _e ¯

¯ ρ e , ψ e

¢ , (15) o` u f (A), f ¡

S ¯

¯ σ ² _s ¢ et f ¡

σ ² _e ¯

¯ ρ e , ψ e

¢ ont été définies précé- demment. Cette structure hiérarchique nous permet d’in- tégrer le vecteur d’hyperparamètre Φ = ©

ψ e , σ ² _s ª

de la loi jointe f (Θ, Φ|Y) :

f ¡

A, S, σ ² _e ¯

¯ Y ¢

∝ Y M

m=1

·h

ψ s + ks m k ² i

₋^L+ρs

2

1

_R^L

+

(s m )

¸

× Y N

i=1

1

S

(a i ) Y N

i=1



 Ã

1 σ _e,i ²

!

^L

2

+1

exp

"

−

° ° y i − Sc

^T

_i °

° ² 2σ ² _e,i

#

 .

3 M´ ethodes MCMC

L’estimation des paramètres d’intérêt est effectuée en utilisant des méthodes de Monte Carlo par chaˆınes de Mar- kov (MCMC). Compte tenu du nombre important d’in- connues, nous utilisons l’algorithme de Gibbs pour la gé- nération d’échantillons distribués suivant la loi a posteriori f ¡

A, S, σ ² _e ¯

¯ Y ¢

. Les échantillons simulés sont ensuite uti- lisés pour estimer les sources et les concentrations. Les

étapes principales de cet échantillonneur sont détaillées ci-dessous.

3.1 Echantillonnage suivant ´ f (A|S, σ ² _e , Y)

D’après le modèle d’observation et de la loi a priori sur les coefficients de mélange, nous pouvons écrire :

f ¡ a i

¯ ¯ S, σ _e,i ² , y i

¢ ∝

exp

"

− (a i − µ _i )

^T

Λ

⁻¹

_i (a i − µ _i ) 2

#

1

T

(a i ), (16) o` u

 

 



 

  Λ i =

"

1 σ ² _e,i

¡ S − s M u

^T

¢

T

¡

S − s M u

^T

¢ #

₋₁

,

µ _i = Λ i

"

1 σ _e,i ²

¡ S − s M u

^T

¢

T

(y i − s M )

# ,

(17)

avec u = [1, . . . , 1]

^T

∈ R ^M

⁻¹

. Par cons´equent, a i

¯ ¯ S, σ _e,i ² , y i

est distribué suivant une loi multivariée normale tronquée définie sur le simplex S :

a i |S, σ _e,i ² , y i ∼ N

S

(µ _i , Λ i ) . (18) Lorsque le nombre de composants chimiques est relative- ment faible, la génération des vecteurs a i |S, σ ² _e,i , y i peut s’effectuer grâce à une étape classique de Metropolis Has- tings (M-H). Pour des problèmes de dimensions plus im- portantes, le taux d’acceptation de l’algorithme de M-H peut devenir très petit, conduisant à de mauvaises pro- priétés de mélanges. Dans ce cas, une stratégie alternative basée sur un échantillonneur de Gibbs peut être utilisée (voir [5] et [6]).

3.2 Echantillonnage suivant ´ f ¡ σ ² _e ¯

¯ A, S, Y ¢

La simulation suivant cette loi conditionnelle s’effectue en deux ´etapes :

– Simulation suivant f ¡ ψ e

¯ ¯ σ ² _e ¢

qui est exprim´ee selon : ψ e

¯ ¯ σ ² _e ∼ IG Ã

N ρ e

2 , 1 2

X N

i=1

1 σ ² _e,i

!

, (19)

– Simulation suivant f ¡ σ ² _e ¯

¯ ψ e , A, S, Y ¢

. En regardant attentivement la loi jointe f ¡

σ ² _e , ψ e , A ¯

¯ S, Y ¢ , la loi conditionnelle de σ ² _e,i |c i , ψ e , S, y i est, pour i ∈ {1, . . . , N}, la loi inverse Gamma suivante :

σ _e,i ² |ψ e , c i , S, y i ∼ IG Ã

L + ρ e

2 , ψ e + °

° y i − Sc

^T

_i °

° ² 2

! . (20)

3.3 Echantillonnage suivant ´ f (S|A, σ ² _e , Y)

Pour générer des échantillons distribués suivant la loi conditionnelle des sources f ¡

S ¯

¯ A, σ ² _e , Y ¢

, il est tr`es pra- tique d’´echantillonner suivant f ¡

σ ² _s , S ¯

¯ A, σ ² _e , Y ¢

de la mani`ere suivante :

– Simulation suivant f ¡

σ ² _s |S, A, σ ² _e , Y ¢

. La loi conditionnelle de la variance de chaque spectre source est une loi inverse Gamma (m = 1, . . . , M ) :

σ ² _s,m ¯

¯ s m ∼ IG Ã

L + ρ s

2 , ψ s + ks m k ² 2

!

. (21)

– Simulation suivant f ¡

S|σ ² _s , A, σ ² _e , Y ¢

. La loi conditionnelle de chaque spectre source f ¡

s m

¯ ¯ σ ² _s , A, σ ² _e , Y ¢ est une loi normale `a support positif (m = 1, . . . , M ) :

s m

¯ ¯ σ ² _s , A, σ ² _e , Y ∼ N +

¡ λ m , δ ² _m I L

¢ , (22) o` u

 

 

 

 



λ m = δ ² _m hP _N

i=0

²i,m

η

²_i,m

i

_T

, δ ² _m = hP _N

i=0 1 η

_i,m²

i

₋₁

,

² i,m =

^yⁱ^−S

_c

^−m^c^T^i,−m

i,m

,

et

 



 

η _0,m ² = σ _s,m ² , η _i,m ² = _c ^σ

2^e,i²

i,m

,

² 0,m = 0 L , (23) et o` u S

−m

(respectivement c i,−m ) représente la matrice S (respectivement le vecteur c i ) dans laquelle la m î` ême colonne (respectivement dans lequel le m î` ême coefficient) a été supprimée.

4 Illustration et discussion

4.1 M´ elange synth´ etique

Afin d’illustrer la méthode proposée, nous considérons le

cas d’une cin´etique chimique faisant intervenir trois com-

posantes (M =3). Afin d’obtenir une forme de ces sources

similaire `a celle des spectres d’absorption, celles-ci sont

simul´ees comme une superposition de motifs gaussiens et

lorentziens de param`etres (position, amplitude et largeur)

choisis de fa¸con aléatoire. La réaction est observée à N =

15 instants sur L = 1000 longueurs d’onde (fr´equences).

(5)

Nous avons également considéré que les coefficients de mé- lange ont les même profils d’évolution qu’une cinétique chimique avec un seul intermédiaire réactionnel [3]. Un bruit i.i.d. gaussien de moyenne nulle et de variance adé- quate est ajouté à chaque spectre de mélange de sorte à obtenir un rapport signal à bruit de 20dB. La figure 1 illustre une réalisation du mélange à l’aide de ce modèle synthétique.

10 20 30 40 50

0 0.2 0.4 0.6 0.8 1

temps (min)

abondance

source 3 source 2 source 1

400 600 800 1000 1200 0

2 4

observation # 5

λ (nm) 400 600 800 1000 1200

0 2 4

source 1

400 600 800 1000 1200 0

2 4

source 2

400 600 800 1000 1200 0

2 4

source 3

λ (nm)

Fig. 1 – Exemple de mélange synthétique simulé La figure Fig. 2-a montre une comparaison entre les coefficients de mélange simulés et les estimateurs MMSE obtenus pour une chaˆıne de Markov de longueur N MC = 1000 incluant N b-i = 500 itérations de chauffage. Les coefficients du mélange sont estimés correctement par la mé- thode proposée tout en satisfaisant les contraintes de po- sitivité et d’additivité et permet également de lever l’in- détermination d’échelle.

10 20 30 40 50

0 0.2 0.4 0.6 0.8 1

temps (min)

abondance

(a)

10 20 30 40 50

0 0.2 0.4 0.6 0.8 1

temps (min)

abondance

(b)

Fig. 2 – Coefficients de mélange simulés (croix) et estimés (cercles) avec un a priori gaussien positif (a) ou exponentiel (b) sur les sources.

4.2 Choix de la loi a priori sur les sources

Un second point de la discussion concerne le choix de la loi a priori sur les sources. Comme signalé précédemment, plusieurs choix de lois a priori sont possibles, pourvu que ces lois soient à support positif et permettent de traduire des informations disponibles sur les sources. Le premier modèle proposé est fondé sur une loi normale tronquée comme loi a priori des sources. Une analyse similaire est

men´ee en choisissant une loi exponentielle E (·) de para- m`etre σ _s,m ² :

f ¡ s m

¯ ¯ σ ² _s,m ¢

= Y L

j=1

1 σ ² _s,m exp

· − s m,j

σ ² _s,m

¸

1

_R⁺

(s m,j ).

En comparaison, sont représentés sur la Fig. 2-b les estimateurs MMSE des concentrations fournis par le modèle bayésien basé sur cette alternative. Nous remarquons alors que les résultats sont sensiblement meilleurs que ceux obtenus avec une loi normale tronquée. Concernant la qualité de l’estimation des sources, le tableau 1 récapitule le résul- tat d’une simulation de Monte Carlo, avec 100 réalisations, en conservant la même matrice de concentrations mais en générant aléatoirement des sources. Les performances sont exprimées en terme d’erreur quadratique moyenne norma- lisée, définie selon :

EQMN = X

m,j

(s _m,j − ˆ s _m,j ) ² ± X

m,j

(s _m,j ) ² .

gaussien positif exponentiel

sources 0.0395 0.0117

concentrations 0.0355 0.0047

Tab. 1 – Erreur quadratique moyenne d’estimation des sources et des concentrations pour deux lois a priori.

Cette amélioration de la qualité de l’estimation à la fois des sources et des concentrations montre une meilleur adé- quation de la loi exponentielle pour des signaux de spectro- scopie d’absorption, comparée à une loi normale à support positif.

R´ ef´ erences

[1] A. de Juan and R. Tauler, “Chemometrics applied to un- ravel multicomponent processes and mixtures : Revisiting latest trends in multivariate resolution,” Analytica Chimica Acta, vol. 500, no. 1–2, pp. 195–210, Dec. 2003.

[2] S. Moussaoui, D. Brie, A. Mohammad-Djafari, and C. Car- teret, “Separation of non-negative mixture of non-negative sources using a Bayesian approach and MCMC sampling,”

IEEE Trans. Signal Processing, vol. 54, no. 11, pp. 4133–

4145, Nov. 2006.

[3] S. Moussaoui, C. Carteret, D. Brie, and A. Mohammad- Djafari, “Bayesian analysis of spectral mixture data using Markov chain Monte Carlo methods,” Chemometrics and Intelligent Laboratory Systems, vol. 81, no. 2, pp. 137–148, April 2006.

[4] E. Punskaya, C. Andrieu, A. Doucet, and W. Fitzgerald,

“Bayesian curve fitting using MCMC with applications to signal segmentation,” IEEE Trans. Signal Processing, vol. 50, no. 3, pp. 747–758, March 2002.

[5] N. Dobigeon and J.-Y. Tourneret, “Efficient sampling according to a multivariate Gaussian distribu- tion truncated on a simplex,” IRIT/ENSEEIHT/T´eSA, Tech. Rep., March 2007. [Online]. Available : http ://www.enseeiht.fr/˜dobigeon

[6] C. P. Robert, “Simulation of truncated normal variables,”

Statistics and Computing, vol. 5, no. 2, pp. 121–125, June

1995.

Séparation bayésienne de sources spectrales sous contraintes de positivité et d'additivité

HAL Id: hal-00455608

https://hal.archives-ouvertes.fr/hal-00455608

Submitted on 14 Feb 2010

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.