NMF hiérarchique de rang 2 - Méthode de classification non supervisée par NMF-SAM

CHAPITRE 6 : SEGMENTATION D’IMAGES, DETECTION ET RECONNAISSANCE DE

4 Méthode de classification non supervisée par NMF-SAM

4.1 NMF hiérarchique de rang 2

Dans ces travaux, nous cherchons à identifier puis à reconnaître les spectres purs de chacun des matériaux polluants que l’on retrouve fréquemment sur les fils de rail.

Comme indiqué au Chapitre 5, la Factorisation en Matrices Non-Négatives est la détermination d’une factorisation approchée de la matrice X telle que 𝑋 = 𝑊 × 𝐻. Elle consiste à décomposer un spectre mesuré en un ensemble de vecteurs qui décrivent des classes de données appelé endmembers. C’est la matrice que nous appelons ici H = [h1, …, hk] ; les vecteurs hi sont de dimension N. Les abondances

associées indiquent la proportion de chaque endmember présente dans le spectre mesuré. Elles se trouvent dans la matrice W = [w1, …, wM] ; les vecteurs wi sont de dimension k.

Habituellement, la NMF prend en entrée le nombre de classes souhaitées en sortie, c’est-à-dire le nombre de spectres purs que l’on attend sur l’image et qui correspond au rang k. Or depuis le démarrage de la thèse, l’utilisation de NMF hiérarchiques commence à se développer : au lieu d’une décomposition directe en un nombre donné de classes, il s’agit d’appliquer une segmentation dichotomique, avec un rang k=2, qui fournit un arbre de décomposition binaire. Ceci est particulièrement bien adapté au problème à traiter car il n’y a aucun moyen de prédire combien de matériaux seront présents sur l’image ni combien de spectres purs la composent.

Nous n’avons aucune information a priori sur l’état de surface des rails observés, nous ne savons pas s’ils sont propres ou pollués. Dans le second cas, la pollution peut être un polluant unique ou un groupement de plusieurs matériaux. Ceux-ci peuvent avoir des spectres relativement proches, ne permettant pas une bonne séparation en NMF classique. Puisque nous ne connaissons pas le nombre de clusters nécessaire ou le niveau de corrélation des spectres entre eux, la solution a été d’orienter les

Figure 82 - Processus de concaténation des lignes en colonnes. Gauche : cube spectral LxPxN. Droite : cube concaténé en dimension 2, MxN.

135 | P a g e

travaux vers une NMF itérative de rang 2 (2-NMF), soit k=2 (Figure 83). Elle permet une classification hiérarchique en 2i_{sous-groupe où i est le nombre d’itérations.}

Cette structure hiérarchique génère un arbre binaire, menant à une décomposition de plus en plus fine (Figure 84). Notre stratégie consiste à recueillir à chaque itération i les résultats de la 2-NMF puis de calculer pour chaque pixel-vecteur un score comparant son spectre à ceux des endmembers obtenus. Ainsi le score maximal indique la famille d’appartenance du pixel.Pour notre application, le score a été calculé de deux façons différentes : par utilisation de la matrice d’abondance et par calcul de l’angle spectral (SAM). Ces deux méthodes sont décrites au paragraphe intitulé « Méthode de classification suite au démixage : SAM ou matrice d’abondance ».

Critère d’arrêt :

Un paramètre d’importance dans la NMF itérative est son critère d’arrêt. Il correspond par exemple au nombre de clusters souhaités, à un niveau de décomposition fixé ou à un paramètre variable suivant la situation traitée. Il détermine la segmentation finale de l’image et joue un rôle important dans la détection des matériaux sur la surface des rails Les résultats présentés ont été obtenus en utilisant comme critère d’arrêt le niveau de décomposition souhaité.

Celui-ci est choisi de façon empirique, basée sur l’expérimentation, suite à l’analyse visuelle des résultats de classification, en fonction du matériau recherché. Nous donnons donc en entrée le niveau de décomposition souhaité (implicitement le nombre de classes souhaitées).

Les niveaux de décomposition i testés ont pris des valeurs entières dans l’intervalle [1,5] soit des segmentations en respectivement 2, 4, 8, 16 et 32 clusters. Le nombre de cluster nécessaire à la bonne

Figure 83 - Décomposition d'une matrice image concaténée (MxN) en deux matrices non négatives (Mx2)*(2xN)

Figure 84 - Exemple d'arbre binaire, de niveau i=4. Le nombre de décomposition obtenue est 2i_{=16. On dira d’un cluster} qu’il est une feuille de l’arbe s’il n’est pas lui-même dépraré en deux classes. A l’inverse, s’il est soumis à la décomposition, on parlera de nœud. Une feuille de niveau i peut devenir un nœud au niveau de décomposition (i+1).

136 | P a g e

segmentation (tous les pixels d’un polluant sont isolés) peut varier en fonction de la matière observée. En effet, des matériaux qui ont des spectres proches sont plus difficiles à séparer et demandent une décomposition plus fine. Nous avons majoritairement utilisé des segmentations à 4 et 8 clusters. Cette démarche donne des résultats satisfaisants ; ils sont explicités au paragraphe 4.3 et sont illustrés par la Figure 87.

Le paramétrage fixé du niveau de segmentation n’est pas forcément optimal, il peut mener notamment à une sursegmentation. Par exemple, des pixels de feuilles de natures et de santés différentes pourraient être classés dans différents cluster alors qu’ils appartiennent tous à la famille des végétaux. Bien qu’ayant peu d’impact, la sursegmentation peut rendre plus complexe l’interprétation, notamment visuelle.

Une première correction possible est le réglage adaptatif du seuil δ introduit au chapitre 5, paragraphe 4.4.1, appliqué aussi bien à la matrice d’abondance qu’à l’angle spectral.

Soit s(i) la variable de classification (voir Chapitre 5). Définissons la fonction de distribution empirique F(δ) :

𝐹(𝛿) =1

𝑛|{ 𝑖 | 𝑠𝑖 ≤ 𝛿}| 6.5

Elle correspond au nombre d’éléments i du cube concaténé tel que s(i) soit inférieur au seuil δ, divisé par l’ensemble des éléments (nombre de pixel) dans le cube concaténé. Ses valeurs sont comprises dans l’intervalle [0,1] et F(0)=0, F(1)=1.

Pour un δ donné, nous obtenons deux classes (C1,C2). Nous souhaitons éviter des déséquilibres trop importants lors de la classification (cluster presque vide ou au contraire contenant presque tous les pixels). Il faut alors que la valeur de δ permette d’avoir des classes de contenance approximativement égale. Mathématiquement, cela s’écrit : F(δ) ≈ 0,5, ce qui est équivalent à minimiser |𝐹(𝛿) − 0,5|. Cette contrainte offre aussi une légère amélioration de la stabilité de décomposition (Figure 85).

Figure 85 - Segmentation des images spectrales par matrice d'abondance. Gauche : sans contrainte. Droite : avec contrainte d'équilibre des clusters.

137 | P a g e

Ouverture pour l’optimisation du critère d’arrêt :

Une piste ultérieure d’optimisation de la classification non-supervisée des pixels est proposée ci-dessous à titre indicatif.

L’analyse des matrices H obtenues aux différents niveaux d’itération a permis de repérer des comportements susceptibles de conduire à l’amélioration significative de la décomposition hiérarchique et du critère d’arrêt :

- Les endmembers sont différents, quel que soit le niveau hiérarchique 2i_{de comparaison,}

- Certains endmember « feuilles » (même nœud ou nœud différent) ont des spectres relativement similaires,

- Certaines « feuilles » de niveau 2i_{ont des spectres proches de ceux des nœuds du niveau 2}i-1_.

Dans le premier cas, la segmentation peut être poursuivie sans plus d’analyse. Les deux suivants peuvent conduire à l’amélioration de la décomposition par calcul de la similarité entre les spectres.

Celle-ci (sans unité) est mesurée de la façon suivante : 𝑠𝑖𝑚𝑖𝑙𝑎𝑟𝑖𝑡é = 1 −1

𝑁× ∑|𝐻𝑖− 𝐻𝑗| 6.6

où N est le nombre de fréquences de l’image (ici N=25), (i,j) deux indices dans l’arbre binaire pour la comparaison des endmembers. L’expérimentation (via l’observation des courbes spectrales et la mesure de similarité) a montré que des spectres très proches ont une similarité supérieure à 0,8.

Lorsque des spectres similaires sont détectés, plusieurs configurations sont possibles : - Si deux clusters Ki

j et Kik du même nœud Ki-1j ont des spectres très proches, la décomposition

n’apporte pas d’information pertinente, elle n’est donc pas nécessaire. La séparation de cette branche est donc stoppée au nœud Ki-1

- Si deux feuilles Ki

j et Kik issus de nœuds différents ont des spectres très proches, l’un voit sa

décomposition stoppée tandis que l’autre est conservée. - Si une feuille Ki

j a un spectre semblable à un nœud de niveau i-1, cette feuille n’apporte plus

d’information, elle est tronquée. En d’autres termes, le sous-ensemble correspondant est vide. L’algorithme de segmentation s’arrête lorsque:

Nombre de clusters niveau 2i_{≤ 1+Nombre de cluster niveau 2}i-1

Cette optimisation de la décomposition devrait réduire la sursegmentation et permettre de stopper automatiquement l’algorithme après un nombre optimisé de décompositions.

138 | P a g e

Dans le document Evaluation de l'adhérence au contact roue-rail par analyse d'images spectrales (Page 135-139)