• Aucun résultat trouvé

Identification moléculaire par spectrométrie de masse haute

Chapitre 5 : Identification moléculaire par spectrométrie de masse haute résolution :

3 La stratégies d’identification

3.1 Caractérisation moléculaire par LC-QTOF

3.1.2 Le traitement des données

Les données acquises sont retraitées avec le logiciel MassHunter Qualitative (Agilent Technologies, France). Suivant les méthodes d’acquisition, deux stratégies d’identification sont mises en place (Figure 40). Ces deux démarches diffèrent sur la manière de rechercher les ions d’intérêt.

a. Sélection des molécules d’intérêt dans les échantillons complexes

La méthode pour mettre en évidence les composés d’intérêt est généralement longue en terme de retraitement de données puisque elle est effectuée préférentiellement dans le cas d’échantillons complexes contenant beaucoup de signaux.

Á l’issue de l’analyse en mode MS, les ions présents dans l’échantillon sont recherchés automatiquement par une fonction du logiciel (Feature by Molecular Extraction, MFE) permettant d’extraire les ions par leurs caractéristiques moléculaires (i.e. temps de rétention, intensité…) via un algorithme. Les paramètres d’extraction sont définis par l’observation du chromatogramme. Généralement, tous les ions qui possèdent une intensité supérieure à 10 fois le bruit de fond sont recherchés. L’état de charge maximum, la formation de molécules protonées ou déprotonées et la présence possible d’adduit sont renseignés préalablement avant le lancement de l’algorithme. Les ions [M+H]+, [M+NH4]+, [M+Na]+ et [M+K]+ sont rentrés dans les paramètres d’attribution lors des analyses en mode d’ionisation positif et [M-H]-, [M+Cl]-et [M+HCOO]- pour le mode négatif. D’après le fournisseur, la fonction MFE est capable de repérer les adduits présents et de générer une masse mono-isotopique pour la molécule neutre la plus juste possible. Les masses mono-mono-isotopiques des ions détectés sont établis automatiquement. La formule brute des composés détectés est ensuite établie automatiquement en se basant sur la masse mono-isotopique mesurée et l’amas isotopique obtenu au cours de l’acquisition. La formule est déterminée en utilisant les atomes C, H, N, O, S, F, P, Cl et Br. Seule les formules possédant un score supérieur à 50 % sont générées. Ce score comprend l’adéquation entre masse mesurée et masse théorique obtenue par les atomes constitutifs, l’abondance et l’espacement de chaque pic du profil isotopique. La même démarche est effectuée sur les échantillons et les blancs protocoles associés. Les listes générées de molécules détectées dans les échantillons et dans les blancs sont ensuite comparées via le logiciel MassProfiler (Agilent technologies, France). Un exemple de comparaison, entre les signaux detéctés dans une eau brute et une eau traitée de STEP, est montré en Figure 41. L’utilisation du logiciel MassProfiler permet de visualiser rapidement les molécules présents dans tel ou tel échantillon et/ou présent dans le blanc de protocole. Ainsi, cette étape permet de distinguer les composés présents uniquement dans un échantillon de manière à réduire la liste des molécules détectées en se focalisant seulement sur les composés d’intérêt (i.e. non détectés dans le blanc, seulement présents dans l’échantillon

136 sélectionné). Les ions précurseurs de ces molécules sont alors sélectionnés pour être fragmentés. L’échantillon est de nouveau injecté mais l’acquisition s’effectue en mode MS/MS afin d’obtenir les spectres de fragmentation de chaque molécule d’intérêt.

Figure 41 : Comparaison de données par MassProfiler. Les échantillons présentés sont des eaux d’entrée et de sortie de STEP. Un code couleur est donné pour chaque échantillon. Un point représente une molécule obtenue

par la fonction MFE du logiciel MassHunter Qualitative.

b. Choix des composés d’intérêt dans les échantillons peu complexes

Outre l’acquisition des données, la démarche pour sélectionner les molécules d’intérêt est légèrement différente pour les échantillons peu complexes. Bien qu’il soit possible d’effectuer la même stratégie que pour les échantillons complexes, une recherche manuelle des ions est ici privilégiée (Figure 40). La méthode automatique pouvant posséder certaines limites (Chapitre 5, section 4, p143), la démarche manuelle est préférée quand elle est possible à mettre en place. Par l’observation du chromatogramme, les ions les plus intenses sont sélectionnés, c’est-à-dire ceux se détachant visuellement du bruit de fond. Au temps de rétention donné, l’ion pseudo-moléculaire est repéré et la formule brute est ensuite générée automatiquement par la sélection de l’amas isotopique en utilisant les atomes : C, H, N, O, S, F et P. Les atomes de chlore et de brome ayant une signature isotopique caractéristique sont ajoutés dans les paramètres lorsque leur présence est identifiée. Tout comme pour la stratégie d’identification réalisée pour les échantillons complexes, seules les formules les plus probables (score > 50%) sont conservées. Les ions détectés dans l’échantillon sont ensuite recherchés manuellement dans le blanc protocole associé et/ou dans un autre échantillon suivant la problématique. Le but est de vérifier l’absence de l’ion dans l’autre échantillon et/ou le blanc afin d’établir une liste d’ions d’intérêt.

137

c. Finalisation de l’identification

Les spectres de fragmentation des ions d’intérêt permettent de donner des informations sur la structure de la molécule et donc d’obtenir son identité. Une fois les spectres obtenus, la démarche d’identification est la même pour les échantillons complexes ou non.

Tout d’abord, les spectres de fragmentation pour les composés à identifier sont comparés aux spectres de fragmentation disponibles dans les banques de données spectrales (Figure 40). Plusieurs librairies pouvant être privées ou en libre-service peuvent être interrogées. Trois bases de données disposant de spectres de fragmentation ont été employées durant ces travaux :

Metlin : banque de données en libre-service pour LC-QTOF possédant 62 020 références (Smith et al., 2005, http://metlin.scripps.edu/index.php).

Forensic : banque de données privée pour LC-QTOF possédant 7 360 composés.

Massbank : banque de données en libre-service et pouvant être continuellement alimentée par les laboratoire d’analyse disposant de 30 521 références (tout type d’instrument analytique confondu) (Horai et al., 2010, http://www.massbank.jp/, http://massbank.ufz.de/MassBank/).

Lorsque les spectres correspondent, le nom du composé est retenu comme candidat et devra être confirmé par l’injection de l’étalon analytique.

Quand il ne peut y avoir de correspondance entre les spectres, des recherches complémentaires sont effectuées afin de réduire au maximum la liste des composés suspects. Des logiciels peuvent aider à l’identification des molécules grâce à des algorithmes mathématiques prédisant la fragmentation des composés associés à la formule brute générée (Chiaia-Hernandez et al., 2014; Gerlich and Neumann, 2013; Schymanski et al., 2014; Wolf et al., 2010). Deux outils ont été utilisés pour l’identification lorsque les librairies de spectres ne permettaient pas de donner des informations :

Molecular Structure Correlator (MSC) : logiciel fournit par Agilent Technologies. L’algorithme est expliqué dans l’article de Hill et Mortishire-Smith (2005).

Metfrag : utilitaire en libre-service sur internet (http://msbi.ipb-halle.de/MetFrag/). L’algorithme est basé sur la prédiction de la fragmentation grâce aux énergies de liaison. Le détail de l’algorithme est rapporté par Wolf et al. (2010).

Ces aides donnent un score de probabilité entre les fragments obtenus et les structures de molécules correspondant à la formule brute établie.

138 Outre l’utilisation de ces logiciels, l’interprétation manuelle du spectre de fragmentation peut révéler des informations sur la structure de la molécule, permettant ainsi de réduire le nombre de composés suspects.

Une diminution de la liste des composés peut également être réalisée par l’utilisation de bases de données moléculaires référençant les propriétés physico-chimiques des composés (Hug et al., 2014). La base de données la plus employée pendant cette thèse est Chemspider qui possède 32 millions de molécules provenant de 490 sources (Chemspider, 2015). La base de données Scifinder® a également été utilisée pour certains résultats lorsque les données disponibles dans Chemspider n’étaient pas suffisantes. Ces bases de données permettent d’accéder aux propriétés des composés.

Un des paramètres aidant à l’identification est le coefficient de partage octanol/eau (log Kow) (Schymanski et al., 2009, 2008). Le log Kow renseigne sur le caractère hydrophile ou hydrophobe des composés et par conséquent sur la probabilité de rencontrer la molécule dans tel ou tel échantillon ou fraction et également au temps de rétention mesuré.

Le nombre de citation d’un composé dans la littérature apporte également une information sur son occurrence dans le milieu environnemental. Plus une molécule est référencée dans une matrice, plus la probabilité de la rencontrer dans l’échantillon étudié est importante (Milman, 2005).

Une fois la liste des composés candidats établis, les étalons analytiques sont achetés, lorsqu’ils sont disponibles commercialement afin de confirmer l’identification. L’étalon est analysé dans les mêmes conditions que le composé présent dans l’échantillon. Le temps de rétention, la masse exacte et le spectre de fragmentation de la molécule de référence sont comparés avec ceux du composé à identifier (Figure 42). L’identification est finalisée lorsque les caractéristiques moléculaires sont identiques.

139

Figure 42 : Exemple d’identification moléculaire par l’analyse de l’étalon analytique réalisée au cours de ces travaux de thèse. La molécule est du DEET (insecticide) détectée dans une rivière grâce à l’EDA (ANR Potomac).

140