• Aucun résultat trouvé

2.5 Discussions

2.5.2 Choix du paramètre gaussien

Dans une première partie, nous comparons l’heuristique définie dans le chapitre 1 avec les hy- pothèses sur le paramètre de la chaleur issues de l’interprétation via l’équation de la chaleur et la théorie des éléments finis. Puis, la différence entre le noyau de la chaleur Kh et de la matrice d’af- finité gaussienne sera étudiée en fonction du paramètre de la chaleur. Enfin, un cas limite d’étude entre la version continue et la version discrète sera présenté.

Lien avec l’heuristique

Dans l’approximation intérieure de l’ouvert Ωi par un ouvert Oi, δi = infy∈Oiδi(y) représente

la distance de Oi à Ωi où δi(y) est la distance d’un point y ∈ Oi à ∂Ωi, la frontière de Ωi. Avec

l’interprétation par les éléments finis, tous les points xi de Σ appartiennent à l’intérieur de l’ouvert

O et l’ouvert O est la réunion de tous les éléments finis K de la triangulation Th, comme le montre

la figure 2.16 :

O = [

K∈Th

K.

La distance de séparation δ = infiδi peut alors être exprimée en fonction du pas de discrétisation

h. D’après la définition de la séparation entre Ω et O et la représentation discrète, la distance δ est homogène à h :

δ ∝ h. (2.52)

De plus, les résultats démontrés précédemment ont permis de définir deux conditions (2.20) et (2.47) sur la paramètre t :

h3p+2<< t2 << δ4.

Autrement dit, avec l’équation (2.52), le paramètre t est fonction du pas h et est borné par : h3p+2<< t2 << h4.

2.5.2 Choix du paramètre gaussien 69

(a) Exemple1 : N = 302 points

(b) V1,1 (c) V1,2 (d) V1,3

(e) Produit (A + IN)M V1,1 (f) Produit (A + IN)M V1,2 (g) Produit (A + IN)M V1,3

(h) Produit AV1,1 (i) Produit AV1,2 (j) Produit AV1,3

Figure 2.10 – Exemple 1 : Fonction propre discrétisée V1,i et produits (A + IN)M V1,i, AV1,i pour

70 Classification et éléments spectraux de la matrice affinité gaussienne

(a) Corrélation ω en fonction de t (b) Norme α en fonction de t

(c) Corrélation τ en fonction de t (d) Norme β en fonction de t

Figure 2.11 – Exemple 1 : Corrélation et différence en norme entre V1,i et, respectivement, les

vecteurs propres Xl de (A + IN)M et Yl de A, pour i ∈ {1, 2, 3}

(a) Corrélation τ en fonction de t et du pas h pour V1,1

(b) Corrélation τ en fonction de t et du pas h pour V1,2

(c) Corrélation τ en fonction de t et du pas h pour V1,3

Figure 2.12 – Exemple 1 : Influence de la discrétisation sur la corrélation entre V1,i et les vecteurs

2.5.2 Choix du paramètre gaussien 71

(a) Exemple 2 : N = 368 points

(b) V1,1 (c) V1,2 (d) V1,3

(e) Produit (A + IN)M V1,1 (f) Produit (A + IN)M V1,2 (g) Produit (A + IN)M V1,3

(h) Produit AV1,1 (i) Produit AV1,2 (j) Produit AV1,3

Figure 2.13 – Exemple 2 : Fonction propre discrétisée V1,i et produits (A + IN)M V1,i, AV1,i pour

72 Classification et éléments spectraux de la matrice affinité gaussienne

(a) Corrélation ω en fonction de t (b) Norme α en fonction de t

(c) Corrélation τ en fonction de t (d) Norme β en fonction de t

Figure 2.14 – Exemple 2 : Corrélation et différence en norme entre V1,i et respectivement les

vecteurs propres Xl de (A + IN)M et Yl de A, pour i ∈ {1, 2, 3}

(a) Corrélation τ en fonction de t et du pas h pour V1,1

(b) Corrélation τ en fonction de t et du pas h pour V1,2

(c) Corrélation τ en fonction de t et du pas h pour V1,3

Figure 2.15 – Exemple 2 : Influence de la discrétisation sur la corrélation entre V1,i et les vecteurs

2.5.2 Choix du paramètre gaussien 73

Figure 2.16 – Estimation de la distance δ

Revenons à l’estimation heuristique (1.2) du paramètre σ développée dans le chapitre 1. Le terme σ est une fonction de la distance référence σ0 définie par :

σ0 =

Dmax

N1p

.

Cette distance représente la distance de séparation dans un cas où la distribution des points est équirépartie c’est-à-dire lorsque les points d’une même composante connexe sont équidistants. Dans ce contexte de maillage et d’éléments finis, cette définition correspond à une estimation du pas de discrétisation moyen. Donc la définition de l’heuristique, c’est-à-dire la distance référence σ2, satisfait les conditions (2.20) et (2.47). L’heuristique (1.2) vérifie alors la condition (2.20) pour lesquelles les vecteurs propres seront très localisés sur les composantes connexes.

Différences entre le noyau de la chaleur KH et la matrice affinité A

Quelques différences apparaissent dans les définitions respectives de la matrice affinité (1.1) et du noyau de la chaleur. Rappelons la formule reliant le noyau de la chaleur KH et la matrice affinité définie dans l’algorithme 1 (1.1) :

KH  σ2 2 , xi, xj  = 2πσ2p2 (A + IN)ij.

Donc l’affinité Gaussienne utilisée pour l’algorithme 1 n’utilise pas le coefficient de normalisation (2πσ2)−p/2 et la diagonale de la matrice A est nulle.

La mesure de qualité basée sur les ratios de normes de Frobenius présentée dans le chapitre 1 est utilisée pour comparer les différences entre les noyaux. La moyenne des ratios de normes de Frobenius introduits dans la section 1.3.1 sur chaque cluster est étudiée en fonction du paramètre t.

rmoy= 1 3 3 X i=1 3 X j=1,j6=i kLijkF kLiikF .

Si rmoyest proche de 0, l’affinité inter-classes est alors négligeable par rapport à l’affinité intra-classe. Ce cas s’approche d’un cas idéal de partitionnement des données où l’on considère des clusters bien séparés. Ce critère rmoy est donc observé respectivement pour le noyau de la chaleur et l’affinité de

74 Classification et éléments spectraux de la matrice affinité gaussienne

(a) Affinité gaussienne A en fonction de t (b) Noyau de la chaleur en fonction de t

Figure 2.17 – Exemple 2 : Mesure de qualité de clustering en fonction de t

clustering spectral et représenté figure 2.17. L’allure des courbes de la figure 2.17 (a) pour l’affinité gaussienne de l’algorithme est plus linéaire que celles de la figure 2.17(b). De plus, l’amplitude de la variation est différente d’un rapport de 10 en raison de l’absence de coefficient de normalisation (4πt)−p2 avec t ≤ 1. Cependant, le support sur lequel rmoyest nul est identique dans les deux cas et

donc le comportement par classe est identique mais avec une plus forte variation avec la définition de l’affinité gaussienne. Ceci tend à valider le choix de rmoy comme critère d’un bon clustering.

Cas limite

Cependant, des limites peuvent apparaître lors du passage du continu au discret. L’exemple représenté par la figure 2.18 où l’on considère des couronnes larges concentriques montre que le résidu de l’équation (2.49) dépend de la discrétisation et de la séparation des classes. En effet, sur les graphes de la figure 2.19 la valeur t = th coïncide avec l’optimum dans le continu mais est très éloigné de l’optimum lors du passage au discret, ce qui est représenté sur la figure 2.18 où le résultat du spectral clustering pour t = th est tracé. Ainsi la séparation entre les classes est trop faible pour

avoir un résidu négligeable et conserver la propriété géométrique sur les vecteurs propres. 2.5.3 Passage du discret au continu : Triangulation de Delaunay

Cette interprétation de la classification spectrale requiert de revenir à une formulation continue en vue de dégager une propriété de classification pour enfin revenir à un ensemble fini de points via un maillage par éléments finis. Cependant, cette représentation par éléments finis, à savoir définir un maillage pour tout ensemble fini de points, est-elle réaliste ?

Les hypothèses d’isotropie de distribution des données et la régularité, la quasi-uniformité du maillage permettent de définir un maillage pour un ensemble quelconque de points via la trian- gulation de Delaunay. En effet, les triangulations de Delaunay [47] présentent des propriétés de régularité utiles pour l’approximation par éléments finis.