• Aucun résultat trouvé

Partie 1 : Télédétection 21

3.5 Troisième méthode proposée : NMF LQ Multiplicative

Une autre manière de s’affranchir des pas de descente dans l’algorithme LQ Grd (section

3.3.2) est de développer une version multiplicative de cet algorithme. L’algorithme multiplicatif

peut s’obtenir à partir de l’algorithme de gradient en choisissant d’exprimer le pas en fonction

des matrices produits [36], comme détaillé ci-dessous pour notre cas.

Nous nous contenterons dans cette partie du modèle bilinéaire, donc sans les termes au

carré.

La mise à jour deAest inchangée par rapport au cas linéaire, c’est donc la même que dans

l’algorithme Linéaire ext (section 3.2.2) :

A←A⊙((XS

T

)⊘(ASS

T

+ε)) (3.29)

On va donc procéder au calcul de la mise à jour multiplicative de la matrice S

a

. Pour cela, on

part de la mise à jour de l’algorithme LQ Grd, d’après lequel on a, pour la source p (pour le

cas d’un modèle bilinéaire et donc sans le dernier terme dans l’expression du gradient (3.21)) :

S

pn

←S

pn

−φ

pn

∂J

∂S

pn

(3.30)

avec ∂J

∂S

pn

=[A

a T

(X−AS)]

pn

−P

M j=1,j6=p

[S

a

]

jn

×[A

bT

(X−AS)]

(jp)n

79 3.5. TROISIÈME MÉTHODE PROPOSÉE : NMF LQ MULTIPLICATIVE

oùφ

pn

est ici le pas du gradient, qui sera dépendant des indicespetn. A noter qu’on s’intéresse

ici aux mises à jour de la partie linéaire doncS

pn

= [S

a

]

pn

.

Pour choisir l’expression du pasφ

pn

nous suivons le raisonnement suivant. Ce pas φ

pn

doit

être choisi de sorte à donner une mise à jour multiplicative et qui conserve la positivité. Le

premier point est vérifié si le pas contient le terme S

pn

au numérateur (pour permettre une

factorisation dans l’expression (3.30)). Pour obtenir la deuxième condition, il faut faire en sorte

de se débarrasser, dans le terme de droite de (3.30), de tous les termes précédés par un signe

moins (pour aboutir à juste une somme de termes positifs). Une façon de faire est de placer ces

termes au dénominateur du pasφ

pn

, ce qui permettra une simplification lors de la réduction au

même dénominateur dans (3.30).

Suivant ce raisonnement, nous choisissons de fixer les pas φ

pn

comme suit :

φ

pn

= S

pn

[A

T

a

AS]

pn

+P

M

j=1,j6=p

[S

a

]

jn

×[A

T

b

AS]

(jp)n

(3.31)

Le calcul de la mise à jour de la sourcepse fait alors en remplaçant, dans l’équation (3.30),

le pas φ

pn

par son expression (3.31) :

S

pn

S

pn

[A

T a

AS]

pn

+S

pn

×P

M j=1,j6=p

[S

a

]

jn

×[A

Tb

AS]

(jp)n

[A

T a

AS]

pn

+P

M j=1,j6=p

[S

a

]

jn

×[A

T b

AS]

(jp)n

+ S

pn

[

A

aT

(X−AS)]

pn

+S

pn

P

M j=1,j6=p

[S

a

]

jn

×[A

bT

(X−AS)]

(jp)n

[A

T a

AS]

pn

+P

M j=1,j6=p

[S

a

]

jn

×[A

T b

AS]

(jp)n

= S

pn

[A

a T

X]

pn

+S

pn

P

M j=1,j6=p

[S

a

]

jn

×[A

bT

X]

(jp)n

[A

T a

AS]

pn

+P

M j=1,j6=p

[S

a

]

jn

×[A

T b

AS]

(jp)n

(3.32)

On obtient donc finalement la mise à jour multiplicative suivante :

S

pn

←S

pn

× [A

a T

X]

pn

+P

M j=1,j6=p

[S

a

]

jn

×[A

bT

X]

(jp)n

[A

T a

AS]

pn

+P

M j=1,j6=p

[S

a

]

jn

×[A

T b

AS]

(jp)n

+ε (3.33)

où(jp)correspond, comme expliqué dans la section 3.3.2, à la position du vecteur s

j

⊙s

p

dans

la matrice S

b

.

Comme pour le cas linéaire,ε(positif et très petit) est ajouté au dénominateur pour éviter

les éventuelles divisions par zéro.

Il est facile de vérifier sur la mise à jour (3.33) que si la convergence est atteinte, le quotient

est égale à 1 et la valeur à droite est alors égale à S

pn

.

Cet algorithme permet donc, d’une part, de se libérer du pas de descente et de ses

incon-vénients. D’autre part, de par la construction de la mise à jour qui est de forme multiplicative

ne contenant que des sommes de termes positifs, la positivité est garantie à chaque itération,

dès lors que l’initialisation est positive. On peut donc se passer des étapes, présentes dans

l’algorithme LQ Grd et l’algorithme LQ Grd-Newt, qui consistaient à forcer la positivité des

solutions à chaque itération en les comparant à une valeur faible positive (équation (3.16)).

L’algorithme final s’écrit de la manière suivante :

Algorithme LQ mult

1. Mise à jour de la matriceS

a

:

[S

a

]

pn

←[S

a

]

pn

× [A

a T

X]

pn

+P

M j=1,j6=p

[S

a

]

jn

×[A

bT

X]

(jp)n

[A

T a

AS]

pn

+P

M j=1,j6=p

[S

a

]

jn

×[A

T b

AS]

(jp)n

2. Mise à jour de la matriceS

b

à partir deS

a

:

[S

b

]

(jp)n

←[S

a

]

jn

[S

a

]

pn

3. A←A⊙((XS

T

)⊘(ASS

T

+ε))

4. [a

1

(i)· · ·a

M

(i)]←[a

1

(i)· · ·a

M

(i)]/P

M

j=1

a

j

(i)

5. a

j,ℓ

(i)←min{a

j,ℓ

(i),0.5}

La convergence de cet algorithme n’a pas été prouvée théoriquement. Néanmoins, en

pra-tique, le critère décroît et on a bien convergence vers un minimum (comme tout algorithme

de type NMF). Les performances sont d’ailleurs bonnes comme il sera montré dans le chapitre

suivant, où les performances des 4 algorithmes présentés ici seront comparées.

La démonstration théorique de la convergence de cet algorithme pourrait cependant être

un point intéressant à étudier et pourra donc être considérée comme une des perspectives de

ce travail de thèse.

Conclusion

Dans ce chapitre nous avons présenté les méthodes de démélange proposées dans le cadre

de cette thèse pour résoudre notre problématique, à savoir faire du démélange non supervisé

dans le cas d’images hyperspectrales urbaines, et donc avec un modèle de mélange linéaire

quadratique. Quatre algorithmes basés sur la NMF ont été présentés. Le premier correspond

à une adaptation d’une méthode linéaire de la littérature à notre problème, tandis que les 3

autres algorithmes ont été développés spécifiquement dans le cadre de cette thèse pour répondre

à notre problématique, c’est-à-dire pour un modèle linéaire quadratique. Les performances de

ces méthodes seront présentées et comparées dans le chapitre suivant.

Chapitre 4

Tests et performances

Introduction

Dans ce chapitre sont présentées les performances des différentes méthodes décrites au

chapitre précédent ainsi qu’un comparatif entre celles-ci. Les mêmes notations et définitions

que dans le chapitre précédent seront donc utilisées ici.

Les résultats présentés concernent essentiellement des mélanges artificiels obtenus à partir

de vrais spectres de réflectance. Quelques résultats préliminaires avec des images réelles seront

fournis à la fin.

La première section présentera les critères de performance utilisés pour évaluer les

perfor-mances des méthodes sur les données simulées. La deuxième section est dédiée à la description

des conditions de tests ainsi que des données simulées. Dans la section 3 nous présentons une

comparaison des performances des algorithmes sur les différents cas d’études définis dans la

section 2, ainsi qu’une analyse des résultats et du comportement des algorithmes. Dans la

sec-tion 4 une étude des résultats en foncsec-tion du nombre de pixels traités est présentée. La secsec-tion

5 montre finalement les résultats des premiers tests effectués avec des images réelles.