• Aucun résultat trouvé

2. Electron BackScatter Diffraction (EBSD)

3.2 Prétraitements des données d’émission acoustique

Figure 2- 39. Rapport d’amplitude et temps de propagation dans l’échantillon d’alumine au refroidissement.

La courbe de temps de propagation a une allure décroissante, accompagnant la contraction de l’échantillon et des guides d’ondes résultant de la baisse de température. L’évolution est contenue : le temps de vol diminue de 2 µs de 1200°C à l’ambiante. L’amplitude du signal subit également des variations faibles mais plus discontinues (à 397°C notamment). Rappelant que les contacts, entre les capteurs et les guides d’ondes d’une part et entre les guides d’ondes et l’échantillon d’autre part, sont maintenus par des ressorts, ces sauts d’amplitude s’expliquent par une détente faible mais brutale d’un ressort qui a rencontré une résistance dans son logement.

3.2 Prétraitements des données d’émission acoustique

Les données issues de l’acquisition, dites « brutes » ne sont que difficilement exploitables en l’état. En effet, plusieurs opérations sont nécessaires avant de soumettre ces données aux différents algorithmes de classification. Ces manipulations ont pour objectifs :

- d’extraire le maximum de l’information disponible, éventuellement en créant d’autres descripteurs par divers compositions des descripteurs issus de l’acquisition ;

- de filtrer le jeu de données, de manière à être certain de ne conserver que les signaux provenant du matériau étudié ;

- de réduire la dimension du jeu de donnée, afin de ne conserver aucune information redondante et de diminuer les temps de traitement par les algorithmes.

3.2.1. Descripteurs de formes d’ondes

Le logiciel d’acquisition calcule pour chaque signal neuf descripteurs (sélectionnés) pour les formes d’ondes. Dans le tableau 2-3, ces descripteurs sont numérotés de 1 à 9. Afin d’élargir au maximum les possibilités pour décrire les signaux et ainsi faire apparaître les corrélations qui les relient, le jeu initial de descripteurs est agrandi : de nouveaux descripteurs, rapports entre les descripteurs primaires, sont ajoutés. La liste des ces descripteurs supplémentaires est également reportée dans le tableau 2-3.

Parasites électriques

397°C

N° Descripteur Notation Distribution

1 Temps de montée (µs) M Exponentielle

2 Nombre de coups C Exponentielle

3 Durée (µs) D Exponentielle

4 Amplitude (dB) A Normale

5 Fréquence moyenne (kHz) F=C/D Gaussienne

6 Nombre de coups au pic P Exponentielle

7 Fréquence de réverbértation (kHz) FR=(C-P)/(D-M) Gaussienne

8 Fréquence de montée (kHz) FM=P/M Gaussienne

9 Energie (aJ) E Exponentielle

10 Temps de montée relatif M/D Exponentielle

11 Durée / amplitude (µs/dB) D/A Exponentielle

12 Temps de descente (µs) D-M Exponentielle

13 Angle de montée (dB/µs) A/M Exponentielle

14 Angle de descente (dB/µs) A/(D-M) Exponentielle

15 Temps de montée sur descente M/(D-M) Exponentielle

16 Enegie relative (aJ/dB) E/A Exponentielle

17 Nombre de coups au pic relatif P/C Exponentielle

18 Amplitude sur fréquence (db/kHz) A/F Exponentielle

Tableau 2- 3. Liste des descripteurs des formes d’ondes [MOE 07]

La grande majorité des descripteurs ont une distribution exponentielle, ce qui les rend incomparables avec d’autres descripteurs comme l’amplitude ou la fréquence apparente, qui ont des distributions gaussiennes ou suivent une loi normale. Il a donc été choisi d’utiliser le logarithme népérien de ces descripteurs « exponentiels » , de façon à ce que leur distribution se rapproche d’une loi gaussienne. Ensuite chaque descripteur X est normalisé de la façon suivante :

σ

X X

X Equation 2- 16.

X est la valeur moyenne et σ l’écart-type du descripteur X. Ainsi, tous les descripteurs sont ramenés à des échelles comparables. Les données d’émission acoustique sont ainsi décrites dans un espace à 18 dimensions, chaque descripteur représentant l’une des dimensions.

3.2.2. Filtrage des signaux par localisation

En utilisant deux capteurs, il est possible de calculer la position des sources d’émission acoustique selon une procédure de localisation linéaire. Cela nécessite de connaitre la vitesse de propagation dans le matériau. La méthode de Hsu-Nielsen est là encore bien adaptée : en simulant des sources d’EA à des positions bien définies, on peut mesurer la différence entre les temps d’arrivée sur chaque capteur, et en déduire la vitesse de propagation C (figure 2-40) :

[ ] [ ][ ]

s t mm L s mm C ∆ ∆ = / avec L=L2L1 et t=t2t1 Equation 2- 17.

Pour les réfractaires électrofondus de l’étude, les vitesses de propagation sont de l’ordre de 5 600 m/s. Ainsi, après chaque essai, seuls les signaux localisés sont conservés : un signal est localisé s’il est reçu successivement par les deux capteurs, dans un intervalle de temps maximum défini par la distance entre capteurs et la vitesse de propagation. Une seule description de chaque source étant suffisante, le

signal reçu par le premier capteur, donc moins affecté par sa propagation, sera uniquement conservé. Pour les essais à l’ambiante, les signaux localisées à moins de 5 mm des capteurs seront éliminés (la maille de localisation est réduite).

Figure 2- 40. Schéma de principe de la mesure de vitesse de propagation.

L’atténuation mesurée avant l’essai est très faible, de l’ordre de 1 dB seulement sur une longueur d’éprouvette de 150 mm. De ce fait, il ne sera pas nécessaire de corriger l’amplitude de chaque signal en fonction de sa distance aux capteurs. Différents filtres sont enfin appliqués de manière à éliminer les signaux susceptibles de correspondre à du bruit : les signaux de très faibles énergie et les signaux de très haute fréquence (>500 kHz).

3.2.3. Réduction de l’espace de description des données

Cette étape se décompose en deux opérations successives : la sélection de descripteurs par une classification hiérarchique ascendante puis l’extraction de descripteurs par une analyse en composante principale (ACP).

La méthode de sélection choisie est basée sur une analyse des corrélations entre les différents descripteurs : les descripteurs sont regroupés selon leur niveau de corrélation par un algorithme de classification hiérarchique. Nous nous inspirons ici de la méthode décrite par Anastassopoulos et Philippidis [ANA 95, ANA 96] et reprise par d’autres auteurs [KOS 03, KOS 07, MOE 08a, MOE 08b, PAP 98]. La matrice de corrélation linéaire R des descripteurs est une matrice symétrique qui contient les coefficients de corrélation de Pearson r entre tous les couples de descripteurs normalisés X et Y :

= = n i i i y x n Y X r 1 1 ) , ( r

[ ]

−1;1 Equation 2- 18.

r vaut zéro si X et Y sont totalement décorrélés. A partir de ce degré de corrélation entre tous les descripteurs, l’algorithme de classification hiérarchique regroupe les descripteurs les plus corrélés et réactualise la matrice de corrélation après chaque regroupement. Ainsi de 18 descripteurs (assimilables à 18 groupes de descripteurs), on passe à 17 groupes, puis 16, etc. jusqu’à ce qu’ils soient tous regroupés en un seul groupe. Chaque regroupement correspond à un niveau de corrélation précis. Le résultat est donné sous la forme d’un dendrogramme, dont un exemple est donné sur la figure 2-40.

Ce dendrogramme permet d’identifier des groupes de descripteurs les plus corrélés, et aide à en faire une sélection : suivant le niveau de corrélation maximum acceptable, on fixe un seuil, ce qui revient à fixer un nombre de groupes de descripteurs à considérer. Par exemple (figure 2-41a), pour un degré de corrélation égal à 0,5, on coupe le dendrogramme 7 fois, ce qui correspond à 7 groupes de

descripteurs. Dans chaque groupe, on choisira un seul descripteur. L’espace de description des données passe donc de 18 dimensions à 7 dimensions.

Figure 2- 41. (a) Exemple d’un dendrogramme de 18 descripteurs ; (b) Schéma représentant la transformation de l’espace de description. D’après [MOE 07].

L’analyse en composantes principales permet quant à elle d’extraire des descripteurs, c'est-à-dire de nouveaux descripteurs à partir des descripteurs initiaux. Ils auront la particularité d’être complètement décorrélés. Ces descripteurs seront classés d’après la quantité de variance qu’ils représentent. La variance des données pourrait en effet être un indicateur de la pertinence des descripteurs : ceux dont la variance est grande sont susceptibles de discriminer des formes d’ondes différentes. On utilisera donc ce critère pour optimiser le choix des descripteurs à utiliser.

Cette méthode permet, dans un premier temps, de transformer un espace de description non orthogonal en un espace orthogonal. A partir d’un nombre de vecteurs de base de l’espace non orthogonal (ici ce sont des descripteurs de la liste du tableau 2-3), on peut calculer n vecteurs propres qui sont des combinaisons linéaires des descripteurs, et qui ont la particularité d’être tous orthogonaux, c'est-à-dire décorrélés. Le premier vecteur propre correspond à la direction où la variance des données est la plus grande. Cela est schématisé sur la figure 2-41b, dans le cas d’un espace à deux dimensions. Chaque point représente un signal d’émission acoustique décrit par deux descripteurs dans un espace non orthogonal. Le deuxième vecteur propre est orthogonal au premier. Chaque vecteur propre est associé à une valeur propre qui traduit la quantité de variance décrite par chaque vecteur propre. Ainsi le vecteur propre n°1 a une valeur propre supérieure à celle du vecteur propre n°2.

Le calcul des vecteurs propres se fait à partir de la matrice de corrélation Rn des n descripteurs sélectionnés à l’étape précédente. Cette matrice est symétrique par définition et donc diagonalisable sous la forme :

' UDU

Rn = Equation 2- 19.

où D est la matrice diagonale des vecteurs propresλ , U est la matrice des vecteurs propres, donnant i leurs coordonnées dans l’espace non orthogonal des n descripteurs et U’ est la matrice transposée de U.

Dans un deuxième temps, grâce à l’information apportée par les valeurs propres, il est possible de réduire la dimension de l’espace de description des données tout en conservant la majeure partie de l’information contenue dans les données. Cette information est ici quantifiée par la variance. La proportion Pv de la variance totale, expliquée par les k premiers vecteurs propres, est égale à la somme des k premières valeurs propres divisée par la somme de toutes les valeurs propres :

= = = n i i k i i v P 1 1 λ λ Equation 2- 20.

Il est ainsi possible de représenter la courbe de pourcentage de la variance en fonction du nombre de descripteurs comme sur la figure 2-42. Fixer un certain pourcentage (95 %) de variance permet de conserver un nombre réduit de descripteurs. Dans l’exemple, cela conduit à garder les 5 premières composantes principales. 0 20 40 60 80 100 1 2 3 4 5 6 7 8 9 10

Nombre de composantes principales

Pour cent age de l a var iance to ta le (% )

Figure 2- 42. Sélection du nombre adéquate de composantes principales.

A l’issue de cette étape, un dernier filtrage est réalisé. Il consiste en la sélection et l’extraction, par l’utilisateur, des « outliers ». Cette opération est importante puisque ces signaux, généralement peu nombreux mais présentant des caractéristiques extrêmes, peuvent perturber les algorithmes de segmentations employés par la suite. Ainsi, la procédure de prétraitement des données peut être synthétisée sur la figure 2-43.