• Aucun résultat trouvé

2 Classification non supervisée dans le cadre de diagnostic des machines tournantes

2.4 Différentes méthodes de Partitionnement ou de clustering

2.4.7 Méthodes hiérarchiques

A la différence des méthodes basées sur la distance présentées précédemment, les méthodes hiérarchiques produisent une séquence de partitions imbriquées appelée dendogramme (Johnson, 1967). Ce dernier permet tout de même d'obtenir une partition lorsque l'on en considère une coupe transversale à un certain niveau de dissimilarité. Il existe traditionnellement deux types d'approches hiérarchiques :

- les approches ascendantes ou agglomératives qui partent d'un ensemble de n classes constituées d'un unique objet (appelées singletons) et qui vont être itérativement fusionnées de façon à n'obtenir qu'une seule classe à la fin,

- les approches descendantes ou divisives qui, inversement, partent d'une classe contenant toutes les données et s'arrêtent lorsque n singletons ont été crées.

2.4.7.1 Classification ascendante hiérarchique

La classification ascendante hiérarchique est dite ascendante car elle part d'une situation où tous les individus sont seuls dans une classe, puis sont rassemblés en classes de plus en plus grandes. Le principe de base de cette méthode est le suivant : initialement chaque individu est considéré comme une classe, soit n classes. On cherche à réduire le nombre de classes à nbclasses< n , ceci se fait itérativement. À chaque étape, on fusionne deux classes, réduisant ainsi le nombre de classes. Les deux classes choisies pour être fusionnées sont celles qui sont les plus « proches », en d'autres termes, celles dont la dissimilarité entre elle est minimale, cette valeur de dissimilarité est appelée indice d'agrégation. Comme on rassemble d'abord les individus les plus proches, la première itération a un indice d'agrégation faible, mais celui-ci va croître d'itération en itération. L'algorithme continue jusqu'à ce que l'ensemble des individus se retrouve dans une unique classe (Székely & Rizzo, 2005). Chaque classe d'une partition est incluse dans une classe de la partition suivante. Le principal problème de cette méthode hiérarchique est de définir le bon critère de regroupement de deux classes, c'est-à -dire trouver une bonne méthode de calcul des distances entre classes.

Les méthodes hiérarchiques sont déjà utilisées dans le diagnostic des machines tournantes dans différents objectifs, soit d'une manière directe, c'est à dire que l’on utilise directement pour la classification (Karabadji et al., 2014 ; Amarnath et al., 2013) soit indirecte, c’est-à-dire que l’on combine cette méthode à d’autres méthodes de classification

automatique nécessitant la connaissance à priori du nombre de classe optimal ou bien comme outil d’apprentissage des méthodes supervisées (Saimurugana et al., 2011).

2.4.7.2 Arbre de décision

Un arbre de décision est une méthode hiérarchique descendante, composé de plusieurs nœuds internes reliés entre eux par des branches. Ces nœuds internes représentent les états (classes) intermédiaires lors de la construction de l’arbre tandis que les branches représentent le processus de construction. Il possède également un certain nombre de nœuds terminaux ou feuilles, correspondant aux classes finales, auxquels on associe un indicateur de classe (étiquette correspondant à son mode de fonctionnement), parmi les M classes du problème à traiter.

L’intérêt de la classification par arbres de décision est de diviser les données contenus dans un ensemble d’apprentissage, par des tests définis à l’aide d’attributs (calcul de distance) jusqu’à ce que l’on arrive à des sous-ensembles de points, obtenus en suivant l’évolution d’un critère, ne contenant presque que des données appartenant toutes à la même classe.

Plusieurs variantes de l'arbre de décision ont été utilisées, comme méthodes de classification des données, dans le cadre du diagnostic des roulements en utilisant des paramètres issus des signaux vibratoires et des signaux acoustiques. La différence principale entre ces variantes réside dans les méthodes utilisées pour résoudre le problème de sur- apprentissage de l'AD et le problème de l'expansion (la complexité de l'AD).

Amarnath et al. (2013) ont présenté un arbre de décision induit basé sur l'algorithme classique ID3, plus précisément la variante C4:5. Cet arbre emploie les valeurs des indicateurs de défauts pour décider l'état de roulement (sain, défaut de bague intérieure, défaut de bague extérieure).

Une étude comparative entre les différentes versions de l’AD a été présentée dans l'article (Karabadji et al. 2014) dans le domaine industriel. Pour surmonter les deux challenges de l'AD que sont la complexité et le sur/sous apprentissage et donc améliorer cette méthode en une version non élaguée (Improved Unpruned Decision Tree IUDT), Les auteurs ont proposé d’hybrider l'arbre de décision avec des méthodes de sélection des caractéristiques (Wrapper ou enveloppante pour choisir les attributs les plus pertinents) et une méthode de réduction de dimensions. Ceci convertit le problème de la construction de l'arbre de décision en une exploration combinatoire de l'espace de recherche graphique. Cette comparaison a été élaborée sur une base de 420 signaux vibratoires pour des roulements avec différents états

Chapitre 2 : Classification non supervisée dans le cadre de diagnostic des machines tournantes

68 d'endommagement et différentes vitesses de rotation. Les résultats de cette comparaison ont montré que l'arbre de décision de type REPTree IUDT (avec une précision de 98% et la possibilité de retrouver les indicateurs les plus pertinents pour cette classification qui sont Skewness, RMS, Crestfactor, l'intervalle moyen entre les fréquences des quatre amplitudes maximales (par les ondelettes) est le meilleur choix de l'AD pour le diagnostic des roulements.

Loin de la classification, les auteurs ans l'article (Saimurugana et al., 2011) ont présenté une autre façon pour employer l'arbre de décision, comme outil de sélection des données. Les auteurs ont utilisé l'AD pour sélectionner les caractéristiques des vibrations les plus pertinentes afin d'améliorer la précision de la méthode de classification utilisée, SVM, et de réduire sa complexité de convergence vers une optimum de classification global.

2.5 Conclusion

La reconnaissance des formes peut être utilisée pour le diagnostic des machines tournantes en général ou des roulements en particulier. Dans la littérature du diagnostic, plusieurs méthodes de classification ont été employées. Ces méthodes ont été souvent combinées avec des techniques de traitement du signal afin d'élaborer un diagnostic automatique de la machine. Ces approches ont été appliquées soient sur une base des signaux enregistrés auparavant, ou bien par l’extraction des indicateurs soit du même roulement avec différents états de dégradation (le même défaut mais avec des tailles différentes) ou bien de différents roulements avec différents défauts (défaut bague extérieure, défaut bague intérieure, défaut de bille).

L’application de la méthode de classification dans le diagnostic des machines tournantes se fait soit en se basant sur la qualité de « séparation automatique » des données différentes ou pour trouver un « modèle » qui peut expliquer la relation reliant les données avec leurs classes. Ces méthodes peuvent représenter un choix intéressant dans le cas d'un apprentissage hors ligne d'un système de RdF utilisé par exemple pour la discrimination des signaux vibratoires des roulements avec différents états de dégradation.

En fait toutes ces méthodes s'appuient sur la construction d’un système d’apprentissage reposant sur la définition d'un ensemble fini d'observations. L'utilisation de ces méthodes présente toutefois un inconvénient dans le sens où elle suppose la connaissance a priori de toutes les observations nécessaires à la caractérisation des classes. Or durant le suivi d'un système mécanique qui naturellement passe d'un mode opératoire normal à un autre anormal

implique que les données collectées sur ce système vont connaitre des évolutions dans le temps. La détection et l'analyse de ces évolutions pourra nous apporter des informations supplémentaires d'où la nécessité de mettre en place une méthode capable d'exploiter ce type de données. L'extraction de ces informations complémentaires nécessite un apprentissage continu (en ligne) du système ce qui peut nous permettre d'employer la RdF pour le diagnostic et la surveillance continue des roulements. L'apprentissage en ligne signifie que la RdF peut être utilisée pour classifier les caractéristiques des signaux qui arrivent au fur et à mesure. Cependant dans la surveillance d'un système industriel, certains phénomènes évolutifs peuvent se présenter, le passage d'un mode de fonctionnement vers un autre étant rarement instantané. Ces contraintes de représentation ou de modélisation sont solutionnées avec l'introduction de la théorie de la classification dynamique.

L'utilisation de la classification dynamique permet d'introduire la notion du temps, c'est à dire qu'on pourrait suivre l'évolution temporelle des formes, la quantifier et l'intégrer dans le processus de diagnostic. La différence entre la classification statique et la classification dynamique réside dans la représentation des classes et des objets. Dans la classification statique, les classes et les objets sont statiques c'est à dire que leurs caractéristiques ne changent pas dans le temps. Par contre, dans la classification dynamique, les classes et/ou les objets évoluent, ils changent au fil du temps (Mouchaweh et Lughofer, 2010), les classes peuvent être créées si nécessaire, ou supprimés si la nécessité a disparu, les classes peuvent se déplacer, ou pivoter, les classes semblables peuvent être fusionnées pour former de nouvelles classe, etc. Cette évolution des classes traduit un changement dans les données qui signifient un changement dans le système observé. La classification statique, omet cette évolution temporelle des données exposées par l'évolution des classes. En effet, une classification statique des données qui changent dans le temps ne peut pas être considérée comme une représentation complète d'un système réel qui change naturellement au cours du temps pour passer d'un fonctionnement normal à un fonctionnement anormal. Dans le cas de surveillance des roulements, le changement brutal est toujours associé à l'émergence d'un défaut.

En d'autres termes les méthodes de classification utilisées jusqu'à maintenant dans le diagnostic des machines tournantes n'ont pas été exploitées à leur maximum.

Le chapitre suivant décrit la méthode de classification dynamique, son intérêt dans le diagnostic des roulements. Ce chapitre développe une méthode de classification spécifique au suivi des roulements.

Chapitre 3 :

Contribution à l’étude de diagnostic de défauts par la

méthode de classification dynamique

3 Contribution à l’étude de diagnostic de défauts par la méthode

Documents relatifs