• Aucun résultat trouvé

2.3 Identification des classes

2.3.2 Information apportée par les autres vecteurs

Si P est une matrice doublement stochastique présentant une structure par blocs bruitée, il est attendu que cette structure soit visible via ses vecteurs singuliers dominants

(a)

(b)

Figure 2.9 : Deux propositions de découpages pour la même matrice, et le résultat du processus d’amalgamation défini Section 2.5.2 pour ce découpage sur cette matrice.

(a)

(b)

(c)

(d)

Figure 2.10 : Illustration des différents types de séparations produites par le filtre. (a) : Représentation de la matrice symétrique donc le vecteur singulier analysé est extrait. Cette matrice présente une structure ayant dix blocs diagonaux et de petites perturbations entre ces blocs. Sa structure est visible dans l’ordre naturel. (b)-gauche : en bleu, un vecteur singulier réordonné dans l’ordre croissant, et en pointillés noirs les séparations proposées par le filtre. (b)-droite : Zoom sur la séparation entourée en rouge : pour que la séparation soit correcte, elle devrait coïncider avec le premier indice du bloc de droite. Ici, il est clair qu’elle coïncide avec le dernier indice du bloc de gauche. (c)-gauche : Le vecteur singulier dans son ordre naturel. La séparation entre les blocs entourés en orange et ceux entourés en vert va résulter en une pente douce dans le vecteur réordonné. (c)-droite : La séparation entre les blocs oranges et les blocs verts est floue, certains éléments des deux ensembles peuvent être entrelacés. Le filtre a divisé cette pente douce en deux endroits. (d) : Zoom sur la première séparation retournée par le filtre : il s’agit d’un parasite introduit par la prolongation effectuée sur le vecteur pour éviter les effets de bords lors du produit de convolution.

(excepté le premier) – cf [31]. Concrètement, si P a k blocs de lignes, on s’attend à ce que ses k premiers vecteurs singuliers droits aient une structure constante par morceaux (le premier étant simplement constant), comme on peut le voir sur la Figure 2.11. Sur cette figure, on observe les dix premières valeurs propres de la matrice symétrique de la Figure 2.5(a) – dont on rappelle qu’elle présentait 5 blocs diagonaux –, et ses deuxième, troisième, quatrième et cinquième vecteurs propres – et donc singuliers, cf la propriété 6 – dominants. Au niveau des valeurs propres, la première vaut 1, les quatre suivantes sont autour de 0.65, et on observe un net décrochage à partir de la sixième. Au niveau des vecteurs propres, on observe que chacun fournit une information sur la structure par blocs. A partir du sixième vecteur, on n’a plus d’information sur la structure par blocs. Utiliser plusieurs vecteurs permet de mettre en évidence de nombreux blocs, comme le montre la Figure 2.12 : dans ces images, chaque couleur correspond à un bloc de lignes de P. Sur l’image (a), on voit la projection des lignes de la matrice de la Figure 2.5(a) sur son deuxième vecteur propre dominant ; sur l’image (b), sa projection sur ses deuxième et troisième vecteurs propres dominants ; et sur l’image (c), sa projection sur ses deuxième, troisième et quatrième vecteurs propres dominants. C’est-à-dire qu’en notant P ∈ Rn×n la matrice, u2, u3 et u4 respectivement ses deuxième, troisième et quatrième vecteurs

propres dominants, et ri le vecteur de Rn correspondant à la ieme ligne de P, on affiche :

— sur (a), les n points {Xi}ni=1 en 1 dimension tels que ∀i, Xi = rTi u2,

— sur (b), les n points {Yi}n

i=1 en 2 dimensions tels que ∀i, Yi = (rTi u2, rTi u3),

— sur (c), les n points {Zi}ni=1 en 3 dimensions tels que ∀i, Zi= (rTi u2, rTi u3, rTi u4).

On peut ainsi remarquer l’apport de la prise en compte simultanée de plusieurs vecteurs singuliers dominants sur la détection des classes de lignes de la matrice P. En effet,

(a) (b)

Figure 2.11 : (a) les dix plus grandes valeurs propres de la matrice Figure 2.5. (b) les 2eme, 3eme, 4eme et 5eme vecteurs propres dominants de la même matrice.

la projection des lignes sur un unique vecteur permet de séparer ces lignes en deux groupes. Cette séparation est cohérente avec la structure par blocs de P. L’intégralité de la structure est visible dès la projection sur deux vecteurs, tandis que la projection sur trois vecteurs finit d’accentuer les séparations entre les groupes rose et noir et les groupes rouge et bleu.

Cependant, à la différence des méthodes de clustering spectral classiques, le fait que P soit doublement stochastique impacte ses éléments spectraux de sorte que ses k premiers vecteurs peuvent potentiellement tous faire apparaître l’intégralité de la structure par blocs de lignes de P. En pratique, il semble que toute la structure ne soit pas nettement visible sur un unique vecteur, mais que plus de deux blocs sont malgré tout détectables, comme le montre la Figure 2.11(b). Ainsi, l’information concernant un bloc peut être redondante sur plusieurs vecteurs. Le bruit appliqué aux coordonnées d’un blocs peut

(a)

(b) (c)

Figure 2.12 : Projection des lignes de P dans les espaces vectoriels définis par les 2eme, 3eme et 4eme vecteurs propres de P, soit u1, u2, u3. Chaque couleur correspond à un bloc

diagonal de P. (a) : Projection sur Vect(u2). (b) : Projection sur Vect(u2, u3). (c) :

différent sur deux vecteurs différents, de même que les relations de mitoyenneté entre ces blocs.

Ainsi, combiner l’information venant de plusieurs de ces vecteurs doit permettre de mieux séparer certains blocs : en utilisant une combinaison linéaire de plusieurs vecteurs singuliers on peut obtenir un vecteur sur lequel la séparation entre deux blocs est accentuée par rapport aux vecteurs initiaux, comme cela est montré Figure 2.13. Sur cette figure, on affiche les deuxième et troisième vecteurs propres de la matrice de la Figure 2.5(a), ainsi que le vecteur égal à leur somme. Tous les trois sont triés dans l’ordre croissant, et avec pour chacun, la répartition des éléments des blocs diagonaux de P qui résulte de ces tris. On remarque que le deuxième bloc (astérisque en rouge) n’est pas détectable seul, ni dans le second vecteur où il est mélangé avec le premier bloc – cf Figure 2.13(a) –, ni dans le troisième où il est mélangé avec les troisième et cinquième blocs–cf Figure 2.13(b). Cependant, si l’on somme ces deux vecteurs et que l’on trie le vecteur obtenu dans son ordre croissant, on obtient le vecteur et la répartition de la Figure 2.13(c), où le deuxième bloc est cette fois-ci détectable.

Cette remarque va nous être très utile dans le développement d’un outil permettant d’affiner la détection des blocs. En effet, si nous avons plusieurs vecteurs singuliers à disposition, nous pouvons nous servir de cette information complémentaire pour peaufiner la structure par blocs retournée par le filtre. Nous pouvons notamment tenter de gommer l’effet peigne et l’incertitude qui en découle quant à l’emplacement réel de la séparation entre deux blocs, voire l’éventuel entrelacement d’indices des deux blocs.

Dans la suite, nous allons présenter deux méthodes avec lesquelles nous avons tenté de peaufiner la structure proposée par le filtre de Canny. Pour chacune, nous expliquerons et illustrerons ses limites. On supposera pour cela que l’on cherche à détecter les blocs d’une matrice P ∈ Rn×n doublement stochastique.