• Aucun résultat trouvé

5.4 Les méthodes externes de diagnostic

5.4.3 Diagnostic par reconnaissance de formes

Cette technique de diagnostic fait partie des méthodes externes car elle ne repose pas sur l’existence d’un modèle formel décrivant le comportement du système. Les in-formations disponibles proviennent essentiellement d’une base de données composée des observations et des expériences numériques et humaines sur le système. La reconnaissance de formes (RdF) est la science qui se base sur la définition d’algorithmes permettant de classer des objets ou des formes en les comparant à des formes types. Il s’agit de

dé-terminer la forme type à laquelle une forme donnée ressemble le plus. Les méthodes de RdF constituent des outils importants priviligiés pour la classification automatique des signatures externes correspondant aux différents modes de fonctionnement (normaux, anormaux) d’un système. Le formalisme général et les approches principales existantes dans la reconnaissance de formes sont décrits brièvement dans la suite. Le lecteur inté-ressé pourra consulter [Dubuisson, 1990; Dubuisson, 2001b], pour plus de détails sur la RdF.

Définitions et formalisme général

En reconnaissance de forme, une forme (pattern) est définie par un ensemble de d

paramètres/caractères, appelés aussi individus, de nature numérique ou symbolique. Ces

caractères sont les composantes d’un vecteur formex à d composantes. Une forme peut

donc être représentée par un point dans un espace de représentation de dimension d.

Dans le cas où les caractères peuvent prendre toute valeur réelle, cet espace est noté Rd. Les prototypes sont des points représentatifs dans cet espace. Le problème de RdF

c’est d’associer un point quelconque de l’espace Rd à un des prototypes. Ce problème

devient trivial dans le cas où une nouvelle forme observée n’est pas marquée par au-cune perturbation, et donc il se confondrait dans Rd avec un prototype. D’une manière générale, une zone géométrique est associée à chaque forme-type dans l’espace de repré-sentation à cause du bruit. Cette zone représente une classe en RdF. Le problème de reconnaissance de formes est de trouver les frontières qui séparent les différentes classes (Figure 5.5). Suivant sa position par rapport à l’ensemble des frontières, une nouvelle formexsera associée à une des classes (ω1, ω2, . . . , ωM). C’est l’opération de classification.

Un problème de diagnostic peut se définir comme un problème de reconnaissance de formes. Il suffit juste de définir les éléments suivants : le vecteur forme qui englobe les paramètres observés sur le système et les modes de fonctionnement qui sont représentés par des classes (la caractérisation de fonctionnement devient la caractérisation d’une classe). Une fois ces éléments sont définis, et après avoir déterminé les frontières entre les classes, un système de diagnostic peut être construit, tout en associant à chaque classe une décision et une interprétation possible (mode de fonctionnement). Une nouvelle observation n’appartenant pas à la classe associée au mode de fonctionnement normal implique la détection d’une défaillance tandis que la localisation revient à décider à quelle classe appartient cette nouvelle observation. Cependant, dans beaucoup de problèmes de diagnostic industriel, tous les modes de fonctionnement ne sont pas connus a priori lors de la construction d’un système de diagnostic. En conséquence, l’algorithme de détection basé sur la RdF doit admettre la possibilité qu’il peut provenir une nouvelle forme qui n’appartient à aucune des classes parmi les M classes connues. Il faut donc prévoir un système de décision qui admette ce qui est appelé le rejet :

- Rejet d’ambiguïté : Ce rejet revient à un rejet d’indécision. Il peut arriver qu’une nouvelle forme observée puisse être affectée à plusieurs classes voisines avec des probabilités ou certitudes similaires. Elle est à peu près à la même distance de ces classes et cette distance est petite. Affecter ce point à une des classes peut entraîner un risque de mauvaise décision. Afin de ne pas commettre une erreur qui pourra être dans certains cas très dangereuse, il vaut mieux donc dire qu’on ne sait pas classer cette forme.

- Rejet de distance :Ce rejet correspond à l’apparition d’une nouvelle forme observée

dans une zone éloignée de celle occupée par l’ensemble des M classes. Dans ce

cas, il vaut mieux ne pas commettre une erreur en affectant cette forme à l’une de ces classes : cette forme peut être le représentant d’un nouveau mode de fonc-tionnement pour lequel aucune information dans l’ensemble d’apprentissage n’est disponible a priori. Il est important donc que le système de diagnostic, basé sur la RdF, soit évolutif et donc il sera capable de prendre en compte tout nouveau phénomène et de structurer de nouvelles formes dans des classes appropriées. Le problème du diagnostic par reconnaissance de formes est défini formellement comme suit [Schurman, 1995; Dubuisson, 2001b] :

– Définir les paramètres constituant le vecteur forme x, représentatif de l’état du

système ; la dimension de x est la dimension de l’espace de représentation des

formes ;

– définir lesM classes connues pour lesquelles on dispose d’information : modèle pro-babiliste de comportements, ensemble de vecteurs échantillons pour chaque classe, etc ;

décision d’affecter à une classe, soit la décision de rejeter toutes les classes connues (rejet de distance), soit une indécision ou rejet d’ambiguïté.

Dans la littérature, il existe différentes approches de classification en reconnaissance de formes, parmi lesquelles il est possible de citer les approches probabilistes et les approches floues (algorithmes fuzzy c-means FCM,. . .) qui exploitent des modélisations probabi-listes ou floues des formes [Dubuisson, 1990; Dubuisson, 2001b; Devroye et al., 1996; Mas-son et al., 1996], les classificateurs statistiques (le classificateur bayésien, les K plus proches voisins) [Casimir, 1971; Mechraoui et al., 2008; Charniak, 1991] et les réseaux de neurones [Venkatasubramanian et al., 1990] qui sont présentés dans le paragraphe suivant.

Réseaux de neurones

Les réseaux de neurones artificiels (RNA) sont des outils statistiques de l’intelligence artificielle capables d’effectuer des opérations de classification par apprentissage. L’unité de base des réseaux de neurones est le neurone formel (ou cellule), modèle très simplifié d’un neurone biologique. Le neurone formel est conçu comme un automate doté d’une fonction de transfert qui transforme ses entrées en une sortie selon des règles précises. Il s’agit donc d’un ensemble de neurones interconnectés entre eux, organisés dans des couches successives dont chacune prend comme entrées les sorties de la précédente. Le type de connexion varie d’une architecture à une autre. Les Perceptrons Multi-couches (PMC) [Cybenko, 1989; k. hornik, 1991] et les Réseaux à Fonction de base Radiales (RFR) [Broomhead & Lowe, 1988] sont les deux architectures les plus utilisées en sur-veillance industrielle.

Les RNA visent à modéliser les capacités d’apprentissage du cerveau humain. Leur prin-cipal avantage par rapport aux autres outils est leur capacité d’apprentissage et de gé-néralisation de leurs connaissances à des entrées inconnues. Il est possible également d’implémenter les RNA dans des circuits électroniques, ce qui donne la possibilité de traitement en temps réel.

D’une manière générale, l’utilisation des RNA se fait en deux phases :

– La première phase est la synthèse du réseau. Elle consiste à choisir le type de réseau, le type de neurones, le nombre de couches et les méthodes d’apprentissage. Le but est de reproduire le comportement du système à modéliser.

Durant l’apprentissage, le réseau de neurones essaye d’apprendre la relation "ensemble de données en entrée-modes de fonctionnement", ceci va lui permettre d’associer les classes, représentant les modes de fonctionnement, aux formes d’entrées caractérisées par les données du système.

– Durant la deuxième phase, de nouveaux exemples, qui n’ont pas été présentés pendant l’apprentissage, sont présentés au RNA pour juger de sa capacité à prédire les comportements du système modélisé.

Plusieurs algorithmes d’apprentissage ont été développés depuis la première règle d’ap-prentissage de Hebb en 1949 [Hebb, 1949]. Ils sont classés en deux catégories : supervisé et non supervisé :

- Dansl’apprentissage supervisé, la valeur de sortie (classe désirée), que le réseau de neurones doit associer au vecteur d’entrées, est connue. Cette valeur ou vecteur de sortie est fournie par un superviseur (expert) humain. L’apprentissage consiste à modifier les paramètres du réseau de neurones afin de minimiser l’erreur entre la sortie désirée et la sortie réelle du réseau de neurones.

- Dansl’apprentissage non supervisé, aucune connaissance a priori n’est fournie sur la sortie désirée, il s’agit dans ce cas de déterminer les paramètres du réseau de neurones suivant un critère à définir.