• Aucun résultat trouvé

Classification statistique des particules analysées en cryo-MEB-EDX

Méthodologie de caractérisation physico-chimique des particules

II. Analyse individuelle de particules par MEB-EDX

II.4. Classification statistique des particules analysées en cryo-MEB-EDX

Le traitement statistique des résultats de l’analyse chimique élémentaire par MEB-EDX est réalisé par classification hiérarchique ascendante (ou clustering) basée sur l’algorithme dit "des k-means". Le partitionnement en k-moyennes (ou "k-means") est une méthode de partitionnement de données qui permet, étant donné des points et un entier k, de diviser les points en k groupes. Pour ce faire, on considère la distance d’un point à la moyenne des points de son groupe et on cherche à minimiser la fonction correspondant à la somme des carrés de ces distances. Ainsi, cette méthode permet de construire des arbres des correspondances (Figure 36) avec les résultats d’analyse des particules et d’identifier les groupes ayant le plus de similarités, encore appelés "clusters".

Figure 36 : Exemple d’arbre des correspondances des compositions élémentaires de particules, obtenu par Classification Hiérarchique Ascendance sur Composantes Principales

Au préalable, les résultats de l’analyse par MEB-EDX sont vérifiés afin d’éliminer les artefacts analytiques et de s’assurer que le logiciel a bien identifié tous les pics d’émission présents sur les spectres EDX. Il est également important de vérifier que le logiciel a bien identifié le bon élément chimique. En effet, certains éléments ont des raies énergétiques proches et lorsqu’ils représentent une espèce mineure au sein des particules, leurs signaux ne sont pas toujours suffisamment importants pour être correctement identifiés par le logiciel. C’est le cas par exemple pour le soufre et le plomb ou encore le zinc et le sodium.

Dans un second temps, un traitement automatisé avec Excel est appliqué sur les résultats d’analyse élémentaire des particules afin de garder les éléments chimiques que l’on considère comme détectables, considérant la variabilité du fond continu. Des seuils de détection en nombre de coups par seconde enregistrés par les détecteurs sont donc affectés à chacun des éléments chimiques. Pour ce faire, l’ensemble du jeu de données est parcouru afin de déterminer le nombre minimal de coups permettant l’identification puis la quantification de chaque élément chimique, sur l’ensemble de la population.

La méthode adoptée est la suivante :

▪ un élément est considéré comme détectable si l’intensité du signal (en nombre de coups par seconde) à une valeur d’énergie donnée (en keV) est supérieur ou égal à trois fois l’intensité du bruit de fond environnant sur le spectre

▪ compte-tenu de la difficulté d’analyse de ces deux éléments, l’azote et le soufre sont considérés comme détectables si l’intensité de la raie d’émission X est simplement supérieure ou égale à deux fois l’intensité du bruit de fond environnant sur le spectre ▪ le sodium est traité de la même manière que l’azote et le soufre, mais pour une raison différente. En effet, les particules ont été analysées sur des grilles TEM avec une structure

de barreaux de cuivre d’une vingtaine de microns d’épaisseur. Or, la raie la plus énergétique du cuivre (raie L à 0,932 keV) a presque la même énergie que la raie K du sodium à 1,040 keV, ce qui peut entraîner une sous-estimation très forte, voire une absence de quantification du sodium.

Une fois cette étape d’identification et de quantification (pourcentages massiques) des éléments réalisée, une normalisation à 100% des résultats est faite, excluant l’oxygène et dans une certaine mesure le carbone (voir ci-après).

Le clustering n’est pas réalisé de manière automatisée sur l’ensemble de la population de particules. En effet, le principe de cette méthode statistique est d’identifier les clusters en les regroupant selon leurs critères de ressemblance. Cela se fait grâce à l’identification des éléments majoritairement présents dans les particules, qui seront donc structurants au sein des clusters. Outre l’oxygène, exclu du calcul en raison de son caractère ubiquiste (élément omniprésent dans le substrat de collection, mais également dans la matière organique, les oxydes métalliques et un certain nombre d’ions comme les nitrates et les sulfates), il convient également de traiter séparément les particules carbonées et les particules inorganiques. En effet, si on réalise le clustering en prenant en compte l’abondance du carbone, quelle que soit sa valeur, son omniprésence dans le film Formvar® conduirait à identifier toutes les particules comme étant, au moins en partie, constituées de matière organique. Cela n’aurait aucun sens sur le plan environnemental.

Les particules carbonées sont donc séparées des autres. Sont alors considérées comme contenant une quantité significative de carbone les particules en contenant au moins 50% en masse. Puis, au sein de ces particules, sont distinguées les particules constituant le groupe des particules carbonées organiques ou POM (Particulate Organic Matter) dont le pourcentage massique de carbone est compris entre 50 et 80% et les suies qui contiennent au moins 80% en masse de carbone. Il convient de remarquer que la matière organique particulaire pouvant être plus ou moins jeune ou hydratée, il est tout à fait possible que certaines particules de POM aient un pourcentage de carbone inférieur à 50% mais dans ce cas, bien évidemment, la somme des teneurs en carbone et oxygène de ces particules serait égale à 100%, ce qui permet de les identifier aisément.

L’examen de la composition chimique élémentaire des POM et des suies permet d’estimer enfin s’il est utile de procéder plus avant à une analyse statistique sur ces deux classes de particules. Selon les échantillons recueillis, nous verrons que si les éléments chimiques autres que carbone et oxygène sont présents sur peu de particules de ces deux groupes, POM et suies, cela n’est

pas nécessaire. Dans le cas contraire, cela apportera de précieuses informations sur l’état de mélange interne des particules carbonées.

Concernant l’analyse par Classification Hiérarchique Ascendante sur Composantes Principales, trois choses sont à prendre en compte au préalable :

1) il convient d’identifier les éléments rencontrés rarement au sein des particules. S’ils sont présents dans moins de 1% des particules, ils seront exclus de l’analyse. En faisant cela, nous perdons un peu d’information, mais cela permet d’avoir des résultats de clustering plus robustes car les liens de similarités ne seront pas "biaisés" par ces éléments dont la présence occasionnelle peut conduire à des regroupements statistiques factices.

2) comme pour les aérosols carbonés, l’oxygène, toujours en raison de son ubiquité, ne sera pas pris en compte dans l’analyse statistique

3) en raison notamment de sa présence dans le substrat de collection, le carbone ne sera pas non plus pris en compte dans l’analyse statistique de la composition élémentaire des aérosols inorganiques

Ce traitement préalable du jeu de données réalisé, les résultats d’analyse X sont normalisés à 100% avec les concentrations des éléments identifiés majoritairement au sein des particules. L’analyse par Classification Hiérarchique Ascendante sur Composantes Principales est ensuite réalisée à l’aide du programme "FactomineR®", présent dans le logiciel libre de statistique "R".

Les clusters sont identifiés grâce aux éléments chimiques « structurants », c’est-à-dire arbitrairement ceux dont la concentration moyenne dans les particules du cluster considéré est supérieure à la concentration moyenne pour la totalité des particules analysées dans l’échantillon, plus deux fois l’écart-type de la distribution des concentrations dans le cluster considéré. Par exemple, le cluster considéré comme contenant des particules de nitrate de sodium est identifié comme tel lorsque les particules contiennent en moyenne au moins 3% en masse de sodium et 9% en masse d’azote (Tableau 7). Les clusters sont classés en 7 catégories principales : substrat, carbonées, métalliques, aluminosilicates, marines, inorganiques primaires et inorganiques secondaires. Les catégories sont ensuite subdivisées en fonction de l’état de mélange externe (un seul composé) ou interne (mélange binaire ou ternaire de composés).

Tableau 7 : Critères de sélection des particules basés sur les pourcentages massiques élémentaires au sein des particules. Les entrées sont appliquées dans l’ordre (de la première à la dernière ligne)