• Aucun résultat trouvé

2.5 Formation de la matrice des prototypes

3.1.2 S´election et choix d’attributs

La s´election d’attributs consiste `a construire un espace d’attributs au moyen d’un crit`ere d’´evaluation. Ce crit`ere peut quantifier les covariances inter et intra classes, les corr´elations, etc.

Une premi`ere id´ee est de consid´erer un crit`ere de s´election d’attributs `a l’image de ceux d´ecrits dans l’´etat de l’art (cf. section 1.3.2). Comme le but est de rapprocher chaque nuage de prototypes du nuage de donn´ees de mˆeme classe, un crit`ere consisterait `a minimiser la distance entre ces nuages.

L’inconv´enient majeur de cette technique est que la connaissance des classes des donn´ees tests est n´ecessaire ce qui n’est pas forc´ement le cas pour une machine quel- conque. Dans ce cas, les classes des donn´ees tests sont utilis´ees afin de v´erifier les r´esultats de classification et mettre en avant les performances des m´ethodes consid´er´ees.

La plupart des crit`eres d´efinis pr´ec´edemment (cf. ´equations 1.17, 1.18 et 1.19) tendent `a compacter chaque nuage de prototypes, les s´eparer les uns des autres et ainsi contribuer `a augmenter le taux de donn´ees tests correctement assign´ees. Cette approche convient soit quand les nuages de prototypes de classes diff´erentes se chevauchent dans l’espace d’attributs, soit quand les donn´ees tests sont relativement proches des centres des nuages des prototypes associ´es aux classes correspondantes. Au vu des figures 3.1a et 3.1b, les nuages de donn´ees tests et de prototypes ne se chevauchent pas et cette approche ne peut pas s’appliquer avec succ`es `a notre probl`eme. Il faut alors ´etudier la diff´erence entre les prototypes et les donn´ees tests.

Pour ce faire, nous ´etudions le comportement des attributs, `a savoir les amplitudes des harmoniques r´esultant de la FFT d’une f.e.m.. La figure 3.2a pr´esente les f.e.m. issues de la sonde de flux obtenues par simulation et issues de mesures dans le cas sain `a vide. Au regard de ces r´esultats, les harmoniques de fr´equences : 50, 250, 350, 550, 650, 850, 950, 1750 et 1850 Hz se distinguent du bruit exp´erimental marqu´e par les harmoniques de faibles amplitudes. Ces harmoniques correspondent `a ceux point´es par un zoom et ont une amplitude suffisante pour expliquer la forme filaire des nuages de prototypes et de donn´ees tests des figures 3.1a et 3.1b.

La diff´erence entre les prototypes et les donn´ees tests r´eside alors dans les autres harmoniques de faible amplitude qui peuvent ˆetre assimil´es au bruit exp´erimental (dont les causes ne sont pas ´etudi´ees dans ce travail) : les autres fr´equences que celles pr´e- cit´ees. Les harmoniques de fr´equences 250, 350, 550 et 650 Hz ont ´egalement de faibles

(a) Comparaison d’un prototype et d’une donn´ee test de la classe saine.

(b) Comparaison entre 3 prototypes associ´es aux classes saine, A1 et A1B2B4.

Figure 3.2 – Identification des attributs pour la discrimination des nuages de prototypes en court-circuit.

amplitudes mais sont bien pr´esents dans les prototypes et les donn´ees tests de la figure 3.2a. De plus, ils sont tr`es sensibles aux courts-circuits comme cela peut-ˆetre observ´e dans la figure 3.2b.

Nous choisissons alors de ne retenir que ces harmoniques d’amplitudes non nulles qui se distinguent du bruit exp´erimental. D’apr`es la figure 3.2a, la diff´erence entre les fr´equences 1750 et 1850 Hz des signaux simul´e et mesur´e est plus marqu´ee que les autres fr´equences dont l’amplitude se d´emarque du bruit exp´erimental. Nous proposons alors de les supprimer de l’espace des attributs de mani`ere `a ce que la simulation soit la plus proche possible des mesures. Au final, les 7 harmoniques suivants sont retenus : 50, 250, 350, 550, 650, 850 et 950 Hz.

Par ailleurs, pour utiliser certaines m´ethodes telles que l’Analyse Discriminante Li- n´eaire (cf. section 1.3.1), la matrice de covariance de chaque classe doit ˆetre inversible, ce qui ne serait pas le cas si deux attributs ont une forte corr´elation. Afin de v´erifier ce point, nous introduisons le coefficient de Bravais-Pearson corr (Hú,j, Hú,q) entre les

attributs fj et fq, d´efini par :

corr31Hstl 2 ú,j, 1 Hstl 2 ú,q 4 = cov 31 Hl st 2 ú,j, 1 Hl st 2 ú,q 4 ‡(Hl st)ú,j‡(Hstl)ú,q (3.1) o`u ‡(Hl

st)ú,j est l’´ecart type de l’attribut fj et cov 31 Hl st 2 ú,j, 1 Hl st 2 ú,q 4 est la covariance entre les attributs fj et fq.

Nous ´evaluons la corr´elation pour chacune des 42 paires possibles d’attributs et nous retenons les paires les moins corr´el´ees, i.e. celles dont le coefficient de Bravais-Pearson est proche de 1 en valeur absolue. Cette ´etude a r´ev´el´e que les attributs les moins corr´el´es et dont les amplitudes des harmoniques correspondants dont les plus importante sont les 4 fr´equences 50, 250, 550 et 850 Hz. Ces derni`eres forment l’espace d’attributs Fst dont

nous donnons la sensibilit´e par rapport aux d´efauts dans le Tableau 3.1. Les ´ecarts sont calcul´es `a partir de la diff´erence entre chaque harmonique sain et en d´efaut. L’int´erˆet du tableau est de conforter le choix des attributs ´etant donn´e que le crit`ere de s´election est `a la fois bas´e sur la connaissance de l’expert et la corr´elation.

Fr´equences (Hz) 50 250 550 850 A1 (%) 0.4 23 24 0.5 A1B2B4 (%) 6 671 99 6.1

Table 3.1 – Attributs associ´es aux courts-circuits et ´ecarts d´efaut/sain `a vide. Soient ˆHl

st la matrice des prototypes et ˆYlst la matrice des donn´ees tests appartenant

aux classes de courts-circuits et saine, d´efinies pour une charge l, dans l’espace des 4 attributs du tableau 3.1.

`A l’image de la figure 3.1, la figure 3.3 correspond `a deux repr´esentations 2D-ACP de ˆ

Hl

st, avec l = vide (voir figure 3.3a) et l = 12.5kW (voir figure 3.3b). Ces repr´esentations

conservent environ 98% de la dispersion des prototypes. Nous avons choisi de repr´esenter les donn´ees dans des axes orthonorm´es correspondant aux figures de gauche. N´eanmoins, les axes ont des ordres de variation bien diff´erents ce qui implique qu’il est difficile de dis- cerner les nuages de donn´ees. Par cons´equent, nous avons mis en avant une repr´esentation consid´erant des axes non orthonorm´es que nous avons transpos´es pour faciliter la compr´e- hension (l’axe des ordonn´ees des figures `a gauche correspond `a l’axe des abscisses des

figures `a droite).

(a) ˆHvide

st et ˆYvidest .

(b) ˆH12.5kW

st et ˆY12.5kWst .

Figure 3.3 – ACP sur les prototypes en court-circuit pour l =vide et l =12.5kW et projection des donn´ees tests.

Nous retrouvons la dispersion filaire des nuages de prototypes induite par les fortes amplitudes des harmoniques de fr´equences 50 et 850 Hz par rapport aux deux autres (250 et 550 Hz). Les nuages de prototypes associ´es `a chaque classe sont tr`es proches les uns des autres et difficilement distinguables, contrairement `a la figure 3.1. N´eanmoins, nous pouvons remarquer que la disposition des nuages des donn´ees tests par rapport aux prototypes de mˆeme classe est meilleure.

Par exemple, dans la figure 3.3b, les nuages de donn´ees correspondant `a la classe saine (en forme de croix vertes) se superposent. La s´election d’attributs a donc am´elior´e la disposition des nuages de prototypes par rapport aux donn´ees tests mais r´eduit les

distances entre les nuages de prototypes associ´es `a des classes diff´erentes.