5. Variabilité moléculaire de la phase soluble par FT-MS
5.1. Méthodes développées pour l’analyse des spectres de masse à très haute
5.1.1. Choix des échantillons et réduction de la taille des données
Le choix des échantillons est le suivant :
Figure 5.1.1-1 : Les six chondrites sélectionnées pour cette étude font partie des
objets ayant subi les altérations aqueuses les plus intenses.
Chacune des chondrites sélectionnées a déjà fait l’objet d’une description dans les deux
chapitres précédents. Le choix s’est porté ici sur les chondrites ayant subi des intensités d’altération
relativement élevées (types 1 et 2.2). L’échantillon Murchison a été sélectionné pour les nombreuses
études dont sa fraction extractible a fait l’objet (Botta and Bada, 2002; Cronin et al., 1993; Glavin and
Dworkin, 2009; Sephton et al., 2000). Renazzo est une chondrite CR peu altérée dans laquelle des
acides aminés ont déjà été trouvés (Cronin and Pizzarello, 1983)(classée CV2). Une étude récente a
révélé un nombre très important (>10000) d’ions détectables par ESI-FTMS (Schmitt-Kopplin et al.,
2010). Cette étude a aussi montré que le meilleur solvant est le méthanol.
En raison de la multitude d’ions potentiellement détectés, les données produites par l’Orbitrap
demandent une série de traitements avant de pouvoir être utilisées pour comprendre le contenu
chimique de l’échantillon. Cette section présente les développements concernant trois points : la
réduction purement technique des fichiers de données, des outils de représentation permettant
d’apprécier la complexité d’un mélange ainsi que la comparaison des spectres et enfin une méthode
d’attribution de formules brutes pour chacune des masses détectées.
La première étape de réduction concerne l’extraction d’un spectre de masse à partir des
données brutes. L’instrument génère des fichiers en format binaire contenant la collection de chacun
des spectres individuels générés après chaque pulse d’entrée des ions dans l’Orbitrap. Ces spectres
sont repérés en temps depuis le début de l’acquisition. Ils consistent chacun en une série de points
(intensité, m/z). L’appareil permet de faire des moyennes de spectres sur le temps de façon à
augmenter la statistique de mesure spectrale au détriment de l’information temporelle. Les mesures
sont effectuées selon la charte rappelée dans le Tableau 5.1.1-1. Le temps de collection représente le
temps sur lequel les spectres sont sommés (typiquement 30 minutes soit environ 600 spectres). La
zone temporelle est choisie d’après un critère de stabilité du signal d’ions qui prend la forme d’un
plateau sur la durée sélectionnée.
Tableau 5.1.1-1 : Charte d’acquisition des spectres de masse Orbitrap.
Paramètre Valeur typique
Dilution de l’échantillon mg/mL en consigne
Débit de la seringue 3µL/min à 1µL/min
Polarité de l’électrospray Positif/négatif
Potentiel du tube de transfert +90V, +110V, -50V
Fenêtre spectrale en m/z 50-500, 150-1000
Mode d’acquisition FT-MS
Le spectre moyenné est ensuite extrait du fichier binaire au format propriétaire défini par le
constructeur par une suite de routines faisant intervenir le logiciel IGOR et des scripts en Visual
BASIC, développés au laboratoire par Roland Thissen et Jean-Yves Bonnet. Les données sont alors
des fichiers ASCII contenant uniquement des paires de valeurs simple précision en intensité et m/z.
Chaque m/z détecté se retrouve dans un spectre sous la forme d’un profil gaussien. En effet, la
transformée de Fourier opérée par l’instrument est une somme de profils, chacun associé à une
fréquence d’oscillation du potentiel de l’électrode, elle-même associée à un rapport masse sur charge
d’un ion. Plus un ion est abondant, plus la fonction gaussienne associée est intense dans le spectre.
Pour la suite de notre étude, nous chercherons uniquement à déterminer la position en m/z de chaque
profil ainsi que son intensité, de façon à obtenir des fichiers utilisables pour des traitements au moyen
d’ordinateurs personnels courants.
L’étude de la distribution en intensité des points
constituant le spectre brut montre qu’une
très large majorité des points ne porte aucune information chimique. En plus des points loin du centre
d’un profil (la partie réellement informative étant généralement décrite par une quinzaine de points
Figure 5.1.1-4), on décèle une distribution bimodale de points à une intensité très faible et en deçà de
la dynamique nominale de l’instrument. Ce phénomène est visible sur l’histogramme des intensités en
échelle logarithmique, Figure 5.1.1-2.
Figure 5.1.1-2 : Diagramme illustrant la densité des points (à droite) en fonction de
l’intensité en échelle logarithmique pour un spectre de masse (à gauche) représentatif. La
partie rouge représente les points d’intensité plus faibles que 1.50684. Cette valeur correspond
au premier point d’inflexion dans la distribution des points en partant des hautes intensités.
Le signal électrique en sortie du détecteur est filtré automatiquement par l’appareil. Un filtre
passe-haut élimine le bruit blanc du détecteur mesuré en usine. La distribution bimodale des points de
faible intensité est interprétée comme la probabilité qu’une fréquence résiduelle du bruit blanc passe le
filtre. Cette distribution se retrouve dans tous les spectres. La méthode pour les supprimer est la
suivante : on délimite une plage d’intensité qui garantit que les points résultent d’un processus
aléatoire. Ainsi, en trouvant le premier point d’inflexion dans la distribution en intensité, on délimite
une zone au-dessus de laquelle on peut considérer qu’on ne trouve que des points appartenant à la
queue droite de la distribution aléatoire la plus intense. La Figure 5.1.1-3 montre en quoi cette
méthode automatique est efficace pour éliminer des points dans les données Orbitrap.
Figure 5.1.1-3 :
Eléments de statistique
cumulative sur un spectre
représentatif.
Pour ce spectre en particulier,
on peut voir que seulement 13% des
points comptent pour 97% de
l’intensité. Les points marqués en
rouge sont systématiquement éliminés
des spectres. Cependant, cette
méthode ne prétend pas éliminer la
totalité des points non-moléculaires,
elle élimine les structures de données
inutiles pour la suite de l’analyse.
L’étape suivante dans le
traitement de données est la
simplification du signal donné par
chacune des éventuelles molécules
présentes dans l’échantillon. Les
centres des pics sont trouvés par
simple dérivation de la fonction échantillonnée par les points du spectre. L’intensité du point est
calculée par interpolation linéaire à l’abscisse d’annulation de la dérivée, sans compensation de
l’échantillonnage (Figure 5.1.1-4).
Figure 5.1.1-4 :
Diagramme illustrant la
façon dont sont sélectionnés
les points utilisés dans la
suite de l’étude, au détriment
de la description complète de
la fonction gaussienne
calculée par l’instrument.
Ce procédé permet d’isoler
des paires de points correspondant
uniquement à une intensité
interpolée et une masse calculée par
dérivation. Cette opération est
d’autant plus efficace que les pics
sont intenses et nombreux. En effet,
chaque profil gaussien est décrit en
général par une quinzaine de points,
ramenés à un seul point appelé centroïde du pic. Le calcul de la position du maximum par cette
méthode est valide tant que le pouvoir séparateur de l’instrument est suffisant. Dans le cas contraire, il
arrive que plusieurs profils très proches ne fassent apparaitre qu’un seul maximum. L’étude de ces cas
requiert une analyse régressive par ajustement qui n’a pas été faite au cours de ce travail de thèse.
L’ultime étape avant représentation est le recalage en masse des centroïdes. Aucun standard
interne n’est ajouté de façon méthodique à l’échantillon. Cependant, il est possible de profiter d’un
effet mémoire du spectromètre pour suivre dans les données brutes l’évolution de certains pics du
résidu de solution de calibration. La décalibration en masse de l’Orbitrap génère un décalage constant
de la valeur des masses exactes des centroïdes (S. Horst, comm. pers.) dû au changement de certains
points de réglages (A. Makarov, comm. pers.). La soustraction de l’erreur mesurée par rapport à un
résidu de solution de calibration permet de compenser ce décalage systématique.
Dans le document
Empreinte moléculaire des processus post-accrétionnels dans la matière organique des chondrites carbonées
(Page 112-116)