Clustering des donn´ ees de d´ egradation

Dans cette section, nous pr´esentons la technique d’apprentissage non supervis´e que nous

appliquons aux donn´ees de la surveillance en ligne dans le but de partitionner les composants

en groupes. Nous discuterons ´egalement de l’impact de la date d’inspection pour le clustering

sur la qualité de ce clustering. Notre objectif n’est pas de développer une nouvelle méthode

de clustering mais d’´evaluer l’apport d’une approche classique lorsqu’elle est combin´ee avec

une aide `a la d´ecision de maintenance.

7.3.1 Application des K-moyennes sur des donn´ees de d´egradation

Considérons un système de N composants de deux qualités différentes et inconnues mis

en marche à t = 0. Tous les composants sont supposés être neufs à l’instant initial, c’est `

a dire (X_t=0⁽ⁱ⁾ = 0, i ∈ {1, 2, . . . N }). à l’instant d’inspection t = T tous les composants du système sont soumis à une inspection. X_T⁽¹⁾, X_T⁽²⁾, X_T⁽³⁾, . . . , X_T^{(N )} représentent les niveaux de dégradation révélés lors de cette inspection. En cohérence avec les hypothèses présentées

précédemment, les données obtenues sont parfaites, sans bruit de mesure. La figure 7.2a

illustre une distribution de niveaux de dégradation simulés pour différents composants à

l’instant t = T . Pour s´eparer la population des composants en deux groupes nous appliquons

(a) Niveaux de d´egradation des compsants `a l’ins-tant t = T : avant le clustering.

(b) Niveaux de dégradation des compsants à l’ins-tant t = T : après le clustering.

Figure 7.2 – Clustering des composants inspect´es `a l’instant t = T .

l’algorithme des K-moyennes d´ecrit dans Algorithme1.

La proc´edure de l’algorithme des K-moyennes suit un moyen tr`es simple de classer

l’en-semble des niveaux de dégradation à travers un certain nombre de clusters fixés a priori K.

7.3. CLUSTERING DES DONN ´EES DE D ´EGRADATION 103

composants de qualité d’origine. La seconde fait référence à des pièceséquivalentes mais de qualité inférieure. L’idée principale est de définir 2 centro¨ıdes, un centro¨ıde par cluster. En-suite l’algorithme effectue un nombre d’itération prédéfini qui permettent de partitionner les points en 2 clusters. Dans chaque itération, la première étape consiste à affecter chaque point

au centro¨ıde le plus proche. Lorsque tous les points sont affect´es, on recalcule les nouveaux

centro¨ıdes de chaque cluster dans l’´etape suivante. Algorithme 1 Algorithme K-moyennes

1. Initialisation: Datadeg = {X_T⁽¹⁾, X_T⁽²⁾, X_T⁽³⁾, . . . , X_T^{(N )}} donn´ees `a partitionner ; k = 2

nombre de clusters ; N bM axItt = 100 nombre maximum d’it´erations ;

2. Sélection des centro¨ıdes: Générer un ensemble de centro¨ıdes C = {c₁, c₂}. for k ∈ {1, 2} do

ck= X_T⁽ⁱ⁾; end for

while itter ≤ N bM axItt do

3.1. Calcul des distances: Calcul de la distance entre chaque ´el´ement dans Datadeg

avec chaque centro¨ıde dans C. for all X_T⁽ⁱ⁾ ∈ Datadeg do

l(X_T⁽ⁱ⁾, ck) = argminDisctance(X_T⁽ⁱ⁾, ck); end for

3.2. Formation des clusters: for all X_T⁽ⁱ⁾ ∈ Datadeg do

Affecter X_T⁽ⁱ⁾ au centro¨ıde k le plus proche (l(X_T⁽ⁱ⁾, c_k) = min_kl(X_T⁽ⁱ⁾, c_k)),k ∈ {1, 2} end for

3.3. Recalculer les nouveaux centro¨ıdes

for all k ∈ {1, 2} do

c_k= moyenne(X_T⁽ⁱ⁾); X_T⁽ⁱ⁾ ∈ cluster(k) end for

3.4. Incr´ementer le nombre d’it´erations

end while

4 : Sortie: Liste des donn´ees Datadeg = {X_T⁽¹⁾, X_T⁽²⁾, X_T⁽³⁾, . . . , X_T^{(N )}} partionn´ees en 2 clus-ters.

La figure 7.2b illustre le partitionnement des mesures de d´egradation des composants

suivant les deux groupes apr`es l’application du clustering. D’apr`es cette figure on peut voir

clairement que le premier cluster (de couleur bleue) regroupe des composants qui se sont

d´egrad´es moins rapidement depuis l’instant t = 0 que ceux du second cluster (couleur rose).

7.3.2 Impact de la date d’inspection sur la qualit´e du clustering

Dans la sous section qui précède nous avons évoqué la réalisation d’un partitionnement

des données de dégradation de plusieurs composants quand ces derniers sont inspectés à la

mˆeme date. L’objectif de cette sous section est d’investiguer l’impact du choix de cette date

sur l’efficacité du clustering de fa¸con à ce que l’on puisse interpréter correctement dans la suite

de l’étude les comportements et les résultats que nous obtenons par rapport aux différentes

104

PROCESSUS DE D ´EGRADATION : APPRENTISSAGE NON SUPERVIS ´E ET

ESTIMATION DES PARAM `ETRES

(a) Taux de mauvais classements en fonction de la date d’inspection.

(b) Trajectoire de d´egradation des composants.

Figure 7.3 – Impact de la date d’inspection sur la qualit´e du clustering.

Afin d’évaluer l’efficacité d’une méthode de clustering, il est nécessaire de disposer d’un

ensemble d’apprentissage labellis´e. En effet, pour pouvoir se prononcer sur la pertinence

des résultats obtenues, il est nécessaire de comparer les résultats du clustering avec les ca-ractéristiques réelles associées aux données. Nous illustrons la démarche et évaluons les per-formances sur un cas particulier traité en simulation. Dans ce but, nous allons générer dans

un premier temps plusieurs trajectoires de d´egradation pour deux groupes de composants

ayant deux vitesses moyennes de dégradation m1et m2 différentes, avec m1 6= m₂ et la même

variance var₁ = var₂. Nous enregistrons pour chaque composant ou chaque trajectoire le

groupe associ´e (label). Dans un second temps, nous m´elangeons toutes les trajectoires de

me-sures de dégradation obtenues et nous effectuons un clustering sur les données de dégradation. Différentes options sont considérées pour des dates de réalisation de l’inspection commune `

a tous les composants variant entre 1 et 30. En derni`ere ´etape nous comptons le nombre de

composants mal classés, c’est-à-dire ceux qui appartiennent au groupe 1 et ont été attribués au groupe 2 ou vice versa. Ces taux d’erreur sont évalués pour les différentes dates d’inspec-tion considérées. Les résultats obtenus sont illustrés sur la figure7.3a. D’après cette figure on

voit que le taux de mauvais classement (nombre de mauvais classements divis´e par le nombre

total de composants) est très élevé lorsque l’inspection est effectuée après une courte durée après l’instant de mise en service des composants. L’explication de ce résultat est logique et en adéquation avec la représentation de la figure7.3b. En effet sur cette figure il apparait que

quand T prend des valeurs faibles, par exemple `a l’int´erieur du cadre bleu, les trajectoires

forment un nuage global qui rend difficile la distinction entre les diff´erents composants `a

l’œil humain. Il en résulte un taux élevé de mauvais classements. Néanmoins, quand T prend des valeurs élevées le taux de mauvais classements décroit considérablement. Dans ce cas les

trajectoires de dégradations des composants en fonctionnement sont clairement séparées. Cet

exemple illustratif nous donne une idée plus claire sur les possibilités de séparation suivant la qualité lorsque celle-ci est associée à la vitesse de dégradation. En conclusion, nous retenons que plus la date d’inspection est retardée plus le clustering est efficace.

Dans le document Vers une prise de décision robuste en maintenance conditionnelle (Page 117-120)