Récemment recherché

Aucun résultat trouvé

Étiquettes

Aucun résultat trouvé

Document

Aucun résultat trouvé

Accueil Écoles Thèmes

Connexion

Solution avec un crit`ere local

Dans le document Détermination de classes de modalités de dégradation significatives pour le pronostic et la maintenance (Page 78-83)

6

8

10

12

14

Y

1

Y

2

∆

X

(b) dans l’espace de repr´esentation et de covariable

Figure 4.1 – exemple de partition d’un cas g´en´eral avec 3 classes et la covariable de

dimension 2

4.3 Solution avec un crit`ere local

Dans cette section, nous proposons une méthode basée sur un critère local. Ce

dernier peut être interprété comme une vraisemblances locale pondérée en utilisant les

individus qui sont relativement proches dans l’espace de covariable et dans l’espace de

représentation. Nous commen¸cons par décrire ce critère sur lequel la méthode introduite

est basée. Puis, nous présentons des études expérimentales.

4.3.1 Description du crit`ere local

Nous proposons pour chaque individulr,(r= 1, . . . , N) un crit`ere de vraisemblance

locale Lrk, (k = 1, . . . , K) calculé avec les paramètres estimés ˆθk. lr est attribué à la

classek siLrk est maximale parmi lesK valeurs. Afin de tenir compte de la covariable,

nous représentons la proximité dans l’espaceY par un système de voisinage défini dans

la section 2.3.2. Il est `a noter qu’il existe deux approches principales pour d´efinir un

4.3. SOLUTION AVEC UN CRIT `ERE LOCAL 65

système de voisinage : l’approche de la fenêtre et l’approche du graphe. La première

approche est utilis´ee dans ce cas. Cependant, au lieu d’utiliser une fenˆetre uniforme qui

effectue un filtrage simple, nous adoptons la fenˆetre gaussienne qui permet d’attribuer

un poidswri,(i= 1, . . . , N) à chaque individuli quand la fenêtre est centrée en individu

lr. La fonction du poids est d´ecrite comme suit :

wri =e⁻

¹2

(y

i

−y

r

)Σ

−1

(y

i

−y

r

)

T

r, i = 1, . . . , N (4.1)

où Σ = σ2I avec σ un paramètre choisi a priori qui représente la dispersion de la

fenêtre. Un exemple de telle fenêtre est illustré dans la figure 4.2. Le poids wri peut

être interprété par la distance euclidienne entre les individus lr et li dans l’espace de

covariable. Donc, nous pouvons construire une matrice de poids Wy = [wri]_N_×_N dont

chaque ligne r, (r= 1, . . . , N) représente le cas où la fenêtre gaussienne est centrée sur

l’individu l_r. Cette matrice est symétrique avec tous les éléments diagonaux égaux à 1.

Figure 4.2 – exemple d’une fenˆetre gaussienne dans l’espace de covariable

Muni de la matriceWy, nous calculons pour chaque ligne r les p.d.f. pond´er´ees par

les poids wri. Selon la formulation du probl`eme dans la section3.2.2, une observation

est d´efinie comme un incr´ement de processus Gamma ∆xi qui suit une loi Gamma

caractérisée par un vecteur de paramètres inconnu θ_k, (k = 1, . . . , K). Donc, les p.d.f.

pondérées avec la fenêtre centrée en l_r peuvent être décrites comme suit :

¯

fri,k =f(∆xi |θk)·wri (i= 1, . . . , N; k= 1, . . . , K) (4.2)

La valeur de ¯fri,k r´ev`ele d’une part, de la distance entre les individus li et lr dans

l’espace Y, et d’autre part, de la coh´erence de l’individuli d’ˆetre dans la classek. Dans

la figure 4.3 nous montrons la relation entre ¯f_ri,k et les deux facteurs f(∆x_i | θ_k) et

wri. Dans la figure à gauche avec la fenêtre gaussienne, la cohérence d’individu d’être

dans la classe k est plus grande si le carr´e est plus fonc´e.

Y

1

Y

2

fenêtre gaussienne

f( x

1

|θ

k

)>f( x

5

|θ

k

)>f( x

2

|θ

k

)>_{f( x}

r

|θ

k

)>_{f( x}

6

|θ

k

)>_{f( x}

4

|θ

k

)>_{f( x}

3

|θ

k

)

w

r r

>w

r 1

>w

r 2

>w

r 3

>w

r 4

>w

r 5

>w

r 6

les p.d.f

les poids

les p.d.f pondérées

f

r1 k,

>f

rr k,

>f

r2 k,

>f

r4 k,

>f

r3 k,

>f

r5 k,

>f

r6 k,

Figure 4.3 – p.d.f. pond´er´ee avec l’individu central lr

La vraisemblance locale pour la classekoù la fenêtre gaussienne est centrée enlr est

ensuite calcul´ee par le produit desn_V plus grandes valeurs de ¯f_ri,k o`un_V est le nombre

de voisins d´efini a priori. En pratique, il est ´equivalent et plus facile de calculer la log

vraisemblance Lrk qui est d´ecrite par la formule ci-apr`es :

Lrk =

n

V

X

i=1

log ¯f_ri,k^′ (4.3)

o`u les valeurs de ¯f′

ri,k correspondent aux valeurs de ¯fri,k ordonn´ees pour v´erifier la

relation :

¯

f_ri,k^′ >f^¯_r^′₍_i₊₁₎_,k

Nous proposons ensuite une méthode de clustering basé sur ce critère local.

4.3.2 Méthode basée sur le critère local

La méthode basée sur le critère local peut se dérouler en trois étapes comme suit :

1. Définir le paramètre σ qui représente la dispersion de la fenêtre gaussienne et

calculer la matrice du poids Wy = [wri]_N_×_N. Choisir le param`etre nV qui d´efinit

le nombre de voisins d’un individu.

2. Générer une partition initiale en appliquant la méthode classique du K-means dans

l’espace de repr´esentationX. Estimer les vecteurs de param`etres qui correspondent

`a la partition initiale.

3. Pour chaque individu lr, calculer les p.d.f. pond´er´ees de tous les individus selon

l’´equation 4.2. Trouver les nV plus grandes valeurs de ¯f′

ri,k et calculer la log

vrai-semblance locale selon l’´equation 4.3 pour chaque valeur de k. Attribuer l_r `a la

4.3. SOLUTION AVEC UN CRIT `ERE LOCAL 67

classe kqui correspond à la plus grande valeur de Lrk. Répéter cette étape jusqu’à

ce que les appartenances des individus soient stables.

Cette méthode est développée en pseudo code dans l’Algorithme 2.

Algorithme 2 Méthode basée sur le critère local

1: D´efinir la valeur de σ et nV.

2: Calculer Wy = [w_ri]_N_×_N

3: Mettre s = 0 qui repr´esente le nombre initial d’it´eration.

4: G´en´erer une partition initiale Ps

K et calculer les vecteurs de param`etres initiaux

ˆ

Θs={θ^ˆs

1, . . . ,θ^ˆs

K}.

5: r´ep´eter

6: pour r= 1 `a N faire

7: Calculer les p.d.f. pondérées avec lr situé au centre de la fenêtre gaussienne :

¯

f_ri,k^s =f(∆xi |θ^ˆ_k^s)·wri pouri= 1, . . . , N; k = 1, . . . , K

8: ∀k, prendre les nV plus grandes valeurs de ¯fs

ri,k et les noter comme ¯f′^s

ri,k.

9: Calculer la log vraisemblance locale Ls

rk =Pn

V

i=1log ¯f′

ri,k, pour k= 1, . . . , K.

10: fin pour

11: ∀r, attribuer lr `a la classeCk avec Ls

rk la plus grande valeur parmi lesK valeurs.

12: Mettre `a jours les vecteurs de param`etres ˆΘs+1 = {θ^ˆ^s₁⁺¹, . . . ,θ^ˆ^s_K⁺¹} et calculer

∆ ˆΘ =kΘ^ˆs+1−Θ^ˆsk.

13: s=s+ 1.

14: _Θˆs = ˆΘs+1

15: jusqu’`a ∆ ˆΘ = 0

4.3.3 Etudes exp´^´ erimentales

La méthode a été appliquée sur l’exemple présenté dans la figure4.1. Nous précisons

queN = 200,K = 3 etq= 2 dans ce cas. De plus, l’espace de covariableY est suppos´e

être un carréd×davec d= 15. Les 3 classes sont séparées par deux frontières décrites

respectivement par : y2 =y1+ ^d⁽³⁻₃^√⁶⁾ et y2 =d−y1. Cette d´efinition de la partition

donne une égalité de la probabilité a priori d’appartenance de chaque individu. Par

ailleurs, les paramètres théoriques avec la moyenne et la variance sont définis comme

ci-apr`es :

θ1 =

(

m1 = 4

σ2

1 = 2 ^{, θ}² ⁼

(

m2 = 7

σ2

2 = 2 ^{, θ}³ ⁼

(

m3 = 10

σ2

3 = 2 ^(4.4)

Différentes valeurs pournV etσ ont été testées, et nous avons choisi empiriquement

0 5 10 15

0

5

10

15

Y

1

Y

²

(a)dans l’espace de covariable

0 ⁵ ¹⁰ ¹⁵

0

5

10

15

0

2

4

6

8

10

12

14

Y

1

Y

2

∆

X

(b) dans l’espace de repr´esentation et de covariable

Figure 4.4 – solution de la partition sur l’exemple avec nV = 8 etσ = 0.4

La partition obtenue retrouve bien celle th´eorique montr´ee dans la figure 4.1. Nous

avons calculé aussi le taux d’individus mal classés qui est égale à 0.02.

Une analyse de la dissimilarité entre classes théoriques a été effectuée. La

dissimila-rité peut être caractérisée par la valeur de ∆m qui représente la différence des valeurs

moyennes entre deux classes. Nous avons choisi alors ∆m= 1,1.5,2,2.5,3. Pr´ecis´ement,

nous avons d´efini mk = 4 + (k−1)∆m et σ2

k = 2. Pour chaque cas de dissimilarit´e,

nous avons généré 200 expériences suivant la même partition théorique illustrée à la

figure4.1. Les valeurs moyennes des paramètres ont été estimées pour les 200 résultats

obtenus. La figure 4.5 illustre le taux d’individus mal class´es selon diff´erentes valeurs

de ∆m, et le tableau4.1 montre les paramètres estimés. Ê{m¯}et ˆσ{m¯}(resp. Ê{¯σ2}et

ˆ

σ{¯σ2}) représentent l’espérance et l’écart-type des valeurs moyennes (resp. variances)

de 200 expériences théoriques. Ê{mˆ} et ˆσ{mˆ} (resp. Ê{ˆσ2} et ˆσ{ˆσ2}) représentent

l’esp´erance et l’´ecart-type des moyennes (resp. variances) de 200 partitions obtenues

avec la m´ethode propos´ee.

La figure4.5 montre que le taux d’erreur diminue avec la croissance de la

dissimi-larité. Dans le tableau 4.1, les estimations des paramètres (Ê{mˆ} et Ê{ˆσ2}) se

rap-prochent des valeurs théoriques quand la dissimilarité passe de ∆m = 1 à ∆m = 1.5.

Mais les estimations deviennent de moins en moins satisfaisantes avec ∆m > 1.5. En

effet, les estimations des param`etres d´ependent non seulement du nombre d’individus

mal class´es, mais aussi de l’importance de ces individus. Concr`etement, un individu

mal classé dans un cas où les classes sont bien séparées est plus important que dans un

cas où les classes sont moins séparables. Dans cette étude, le taux d’erreur atteint le

minimum avec ∆m= 3, mais les individus mal class´es dans ce cas influencent beaucoup

sur les estimations des param`etres.

Dans le document Détermination de classes de modalités de dégradation significatives pour le pronostic et la maintenance (Page 78-83)

Télécharger maintenant "Détermination de class..."

Outline

Documents relatifs