• Aucun résultat trouvé

2.1. Les bases de données

La première étape de l’interprétation des résultats consiste en une étape de déréplication, c'est-à-dire d’annotation des formules obtenues lors de l’analyse des spectres de masse. Pour ce faire, les formules sont confrontées à des bases de données. L’importance de l’étape de déréplication et du choix des bases de données pour la recherche de métabolites secondaires fait l’objet d’une section particulière dans l’article 1 présenté en introduction. Dans le cadre de cette étude, les résultats ont été soumis à AntiBase 20125. Cette base de données spécialisée dans les produits naturels recense plus de 40 000 métabolites secondaires (de champignons, de bactérie, d’algues, etc.). Les molécules qu’elle comporte sont référencées par propriétés descriptives (masse, formule), physicochimiques (point de fusion, pouvoir rotatoire), spectroscopiques (UV, IR, RMN, HRMS) et biologiques (activité pharmacologique, toxicité), lorsque celles-ci sont disponibles. Dans le cadre de cette thèse, certaines formules reconnues par AntiBase étaient l’objet de multiple suggestions. Les propositions de structures d’origine fongique et en particulier les molécules produites par des moisissures du genre Penicillium ont donc été privilégiées. Pour compléter les données d’AntiBase, des recherches bibliographiques ont été effectuées.

2.2. Validation des annotations : identification

En raison de la faible disponibilité de composés de référence des métabolites secondaires fongiques dans le commerce, les annotations proposées ont été confrontées aux spectres de fragmentation expérimentaux. Cette interprétation permet un premier tri des identifications en mettant en évidence des incohérences entre la structure supposée et le spectre MS/MS expérimental (par exemple, une structure hypothétique sans fonction acide carboxylique ou ester en désaccord avec un spectre MS/MS comportant une perte de CH2O2). Dans un deuxième temps, les hypothèses structurales ont été vérifiées selon les quatre niveaux d’identification décrits par Sumner et al.6

(1) Identification de niveau 1, « Composé identifié ». Métabolite présentant au moins deux données indépendantes identiques à celles d’un composé de référence analysé dans les mêmes conditions expérimentales (temps de rétention et spectre de masse, masse précise et spectre MS/MS etc.). Dans le cadre de cette thèse, les molécules ont été identifiées à un niveau 1 lorsqu’elles présentaient un temps de rétention, un profil MS et un spectre MS/MS identiques à ceux d’un standard.

(2) Identification de niveau 2, « Composé potentiellement annoté ». Métabolite présentant au moins une donnée identique à celle d’un composé décrit dans la littérature ou fournie par un laboratoire extérieur, ou interprétation des résultats permettant de donner une structure précise en termes d’isomérie de position (par RMN par exemple).

(3) Identification de niveau 3, « Classe du composé potentiellement caractérisée ». Composé dont le composé standard n’est pas disponible et dont aucune donnée analytique n’est précisée dans la littérature. Un composé est identifié au niveau 3 lorsque sa classe est définie (peptide, lipide etc.) ou lorsque la structure est définie mais sans que l’on puisse préciser de quel isomère il s’agit. Dans le cadre de cette étude, un métabolite a été qualifié comme identifié au niveau 3 lorsque sa masse était en accord avec celle d’un composé connu et que son spectre de fragmentation était compatible avec cette structure.

Afin d’assister cette étape, l’outil informatique de simulation de spectres MS/MS, CFM-ID7, a été utilisé. Bien que ses résultats ne constituent pas une preuve d’identité du métabolite, ce logiciel permet de conforter des hypothèses structurales en simulant des spectres MS/MS à partir de structures. Dans le cadre de l’analyse des métabolites de P. verrucosum, les hypothèses structurales ont été soumises à CFM-ID pour qu’il en génère les spectres de fragmentation hypothétiques. Ceux-ci ont ensuite été comparés aux spectres expérimentaux.

(4) Identification de niveau 4, « Composé inconnu ». Métabolite dont aucune hypothèse structurale n’est formulée mais qui a été détecté et dont les paramètres analytiques (temps de rétention et masse exacte définis) permettent de le différencier.

À l’issue de cette étape d’identification, les analyses ont été concentrée sur l’élucidation structurale de composés inconnus. L’observation seule de la formule chimique des composés inconnus ne permettant pas d’orienter la suite des analyses structurales, une étape supplémentaire de traitement des données a été mise en œuvre par la réalisation de réseaux moléculaires.

2.3. Réseaux moléculaires : Le “GNPS Molecular Networking System”

L’outil informatique disponible en ligne du GNPS (Global Natural Product Social molecular networking)8 permet d’organiser des données de spectrométrie de masse sous forme de réseaux moléculaires (Figure 21). Par la comparaison des spectres MS/MS vectorisé, il permet d’établir des degrés de similarité entre les profils de fragmentation. Puisque deux molécules qui se fragmentent de manières similaires sont susceptibles d’avoir des structures similaires, ce logiciel permet de lier les métabolites selon leur potentielle similarité structurale.

Figure 21. Lexique relatif aux réseaux

Cette organisation des données permet alors de mettre en évidence des composés inconnus semblables à des métabolites secondaires connus et ainsi de faciliter leur élucidation structurale. En se basant sur les mécanismes de fragmentation préalablement interprétés à partir d’une structure connue, l’élucidation d’un spectre semblable est, en effet, plus aisée que son interprétation sans a priori. D’autre part, en liant les molécules selon leurs potentielles similarités structurales et donc selon leur classe chimique (alkaloïdes, β-lactames etc.), l’observation d’un graphe ou sous-graphe contenant plusieurs ions inconnus peut permettre la mise en évidence de nouvelles classes de métabolites.

Documents relatifs