• Aucun résultat trouvé

Choix des échantillons et réduction de la taille des données

5. Variabilité moléculaire de la phase soluble par FT-MS

5.1. Méthodes développées pour l’analyse des spectres de masse à très haute

5.1.1. Choix des échantillons et réduction de la taille des données

Le choix des échantillons est le suivant :

Figure 5.1.1-1 : Les six chondrites sélectionnées pour cette étude font partie des

objets ayant subi les altérations aqueuses les plus intenses.

Chacune des chondrites sélectionnées a déjà fait l’objet d’une description dans les deux

chapitres précédents. Le choix s’est porté ici sur les chondrites ayant subi des intensités d’altération

relativement élevées (types 1 et 2.2). L’échantillon Murchison a été sélectionné pour les nombreuses

études dont sa fraction extractible a fait l’objet (Botta and Bada, 2002; Cronin et al., 1993; Glavin and

Dworkin, 2009; Sephton et al., 2000). Renazzo est une chondrite CR peu altérée dans laquelle des

acides aminés ont déjà été trouvés (Cronin and Pizzarello, 1983)(classée CV2). Une étude récente a

révélé un nombre très important (>10000) d’ions détectables par ESI-FTMS (Schmitt-Kopplin et al.,

2010). Cette étude a aussi montré que le meilleur solvant est le méthanol.

En raison de la multitude d’ions potentiellement détectés, les données produites par l’Orbitrap

demandent une série de traitements avant de pouvoir être utilisées pour comprendre le contenu

chimique de l’échantillon. Cette section présente les développements concernant trois points : la

réduction purement technique des fichiers de données, des outils de représentation permettant

d’apprécier la complexité d’un mélange ainsi que la comparaison des spectres et enfin une méthode

d’attribution de formules brutes pour chacune des masses détectées.

La première étape de réduction concerne l’extraction d’un spectre de masse à partir des

données brutes. L’instrument génère des fichiers en format binaire contenant la collection de chacun

des spectres individuels générés après chaque pulse d’entrée des ions dans l’Orbitrap. Ces spectres

sont repérés en temps depuis le début de l’acquisition. Ils consistent chacun en une série de points

(intensité, m/z). L’appareil permet de faire des moyennes de spectres sur le temps de façon à

augmenter la statistique de mesure spectrale au détriment de l’information temporelle. Les mesures

sont effectuées selon la charte rappelée dans le Tableau 5.1.1-1. Le temps de collection représente le

temps sur lequel les spectres sont sommés (typiquement 30 minutes soit environ 600 spectres). La

zone temporelle est choisie d’après un critère de stabilité du signal d’ions qui prend la forme d’un

plateau sur la durée sélectionnée.

Tableau 5.1.1-1 : Charte d’acquisition des spectres de masse Orbitrap.

Paramètre Valeur typique

Dilution de l’échantillon mg/mL en consigne

Débit de la seringue 3µL/min à 1µL/min

Polarité de l’électrospray Positif/négatif

Potentiel du tube de transfert +90V, +110V, -50V

Fenêtre spectrale en m/z 50-500, 150-1000

Mode d’acquisition FT-MS

Le spectre moyenné est ensuite extrait du fichier binaire au format propriétaire défini par le

constructeur par une suite de routines faisant intervenir le logiciel IGOR et des scripts en Visual

BASIC, développés au laboratoire par Roland Thissen et Jean-Yves Bonnet. Les données sont alors

des fichiers ASCII contenant uniquement des paires de valeurs simple précision en intensité et m/z.

Chaque m/z détecté se retrouve dans un spectre sous la forme d’un profil gaussien. En effet, la

transformée de Fourier opérée par l’instrument est une somme de profils, chacun associé à une

fréquence d’oscillation du potentiel de l’électrode, elle-même associée à un rapport masse sur charge

d’un ion. Plus un ion est abondant, plus la fonction gaussienne associée est intense dans le spectre.

Pour la suite de notre étude, nous chercherons uniquement à déterminer la position en m/z de chaque

profil ainsi que son intensité, de façon à obtenir des fichiers utilisables pour des traitements au moyen

d’ordinateurs personnels courants.

L’étude de la distribution en intensité des points

constituant le spectre brut montre qu’une

très large majorité des points ne porte aucune information chimique. En plus des points loin du centre

d’un profil (la partie réellement informative étant généralement décrite par une quinzaine de points

Figure 5.1.1-4), on décèle une distribution bimodale de points à une intensité très faible et en deçà de

la dynamique nominale de l’instrument. Ce phénomène est visible sur l’histogramme des intensités en

échelle logarithmique, Figure 5.1.1-2.

Figure 5.1.1-2 : Diagramme illustrant la densité des points (à droite) en fonction de

l’intensité en échelle logarithmique pour un spectre de masse (à gauche) représentatif. La

partie rouge représente les points d’intensité plus faibles que 1.50684. Cette valeur correspond

au premier point d’inflexion dans la distribution des points en partant des hautes intensités.

Le signal électrique en sortie du détecteur est filtré automatiquement par l’appareil. Un filtre

passe-haut élimine le bruit blanc du détecteur mesuré en usine. La distribution bimodale des points de

faible intensité est interprétée comme la probabilité qu’une fréquence résiduelle du bruit blanc passe le

filtre. Cette distribution se retrouve dans tous les spectres. La méthode pour les supprimer est la

suivante : on délimite une plage d’intensité qui garantit que les points résultent d’un processus

aléatoire. Ainsi, en trouvant le premier point d’inflexion dans la distribution en intensité, on délimite

une zone au-dessus de laquelle on peut considérer qu’on ne trouve que des points appartenant à la

queue droite de la distribution aléatoire la plus intense. La Figure 5.1.1-3 montre en quoi cette

méthode automatique est efficace pour éliminer des points dans les données Orbitrap.

Figure 5.1.1-3 :

Eléments de statistique

cumulative sur un spectre

représentatif.

Pour ce spectre en particulier,

on peut voir que seulement 13% des

points comptent pour 97% de

l’intensité. Les points marqués en

rouge sont systématiquement éliminés

des spectres. Cependant, cette

méthode ne prétend pas éliminer la

totalité des points non-moléculaires,

elle élimine les structures de données

inutiles pour la suite de l’analyse.

L’étape suivante dans le

traitement de données est la

simplification du signal donné par

chacune des éventuelles molécules

présentes dans l’échantillon. Les

centres des pics sont trouvés par

simple dérivation de la fonction échantillonnée par les points du spectre. L’intensité du point est

calculée par interpolation linéaire à l’abscisse d’annulation de la dérivée, sans compensation de

l’échantillonnage (Figure 5.1.1-4).

Figure 5.1.1-4 :

Diagramme illustrant la

façon dont sont sélectionnés

les points utilisés dans la

suite de l’étude, au détriment

de la description complète de

la fonction gaussienne

calculée par l’instrument.

Ce procédé permet d’isoler

des paires de points correspondant

uniquement à une intensité

interpolée et une masse calculée par

dérivation. Cette opération est

d’autant plus efficace que les pics

sont intenses et nombreux. En effet,

chaque profil gaussien est décrit en

général par une quinzaine de points,

ramenés à un seul point appelé centroïde du pic. Le calcul de la position du maximum par cette

méthode est valide tant que le pouvoir séparateur de l’instrument est suffisant. Dans le cas contraire, il

arrive que plusieurs profils très proches ne fassent apparaitre qu’un seul maximum. L’étude de ces cas

requiert une analyse régressive par ajustement qui n’a pas été faite au cours de ce travail de thèse.

L’ultime étape avant représentation est le recalage en masse des centroïdes. Aucun standard

interne n’est ajouté de façon méthodique à l’échantillon. Cependant, il est possible de profiter d’un

effet mémoire du spectromètre pour suivre dans les données brutes l’évolution de certains pics du

résidu de solution de calibration. La décalibration en masse de l’Orbitrap génère un décalage constant

de la valeur des masses exactes des centroïdes (S. Horst, comm. pers.) dû au changement de certains

points de réglages (A. Makarov, comm. pers.). La soustraction de l’erreur mesurée par rapport à un

résidu de solution de calibration permet de compenser ce décalage systématique.