• Aucun résultat trouvé

ASICS : un package R pour l'identification et la quantification de m\'etabolites dans un spectre RMN 1H

N/A
N/A
Protected

Academic year: 2021

Partager "ASICS : un package R pour l'identification et la quantification de m\'etabolites dans un spectre RMN 1H"

Copied!
4
0
0

Texte intégral

(1)

HAL Id: hal-02788670

https://hal.inrae.fr/hal-02788670

Submitted on 5 Jun 2020

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Distributed under a Creative Commons Attribution - NonCommercial - ShareAlike| 4.0 International License

ASICS : un package R pour l’identification et la

quantification de métabolites dans un spectre RMN 1H

Gaëlle Lefort, Laurence Liaubet, Cécile Canlet, Nathalie Vialaneix, Rémi

Servien

To cite this version:

Gaëlle Lefort, Laurence Liaubet, Cécile Canlet, Nathalie Vialaneix, Rémi Servien. ASICS : un package R pour l’identification et la quantification de métabolites dans un spectre RMN 1H. Journée Régionale de Bioinformatique et Biostatistique, Génopole Toulouse, Oct 2019, Toulouse, France. 2019. �hal-02788670�

(2)

ASICS : un package R pour l’identification et la quantification de métabolites dans un spectre RMN 1H

G. Leforta, L. Liaubetb, C. Canletc, N. Vialaneixa et R. Serviene

aMIAT, Université de Toulouse, INRA, Castanet-Tolosan, France

gaelle.lefort@inra.fr, nathalie.vialaneix@inra.fr

bGenPhySE, Université de Toulouse, INRA, ENVT, Castanet Tolosan, France

laurence.liaubet@inra.fr

cAxiom Platform, MetaToul-MetaboHUB, National Infrastructure for Metabolomics

and Fluxomics, F-31027 Toulouse, France cecile.canlet@inra.fr

eInTheRes, Université de Toulouse, INRA, ENVT, France

remi.servien@inra.fr

Mots clefs : Metabolomique, Résonance Magnétique Nucléaire (RMN), Quantification de mé-tabolites

Les données dites omiques permettent de décrire le fonctionnement biologique d’un organisme à divers niveaux de l’échelle du vivant : génome (séquence d’ADN), transcriptome (ensemble des ARN présents dans une cellule ou un tissu), protéome (ensemble des protéines), métabolome (ensemble des métabolites), par exemple. L’étude du métabolome suscite un intérêt croissant car, comparativement à d’autres omiques, il est plus proche des phénotypes observés d’intérêt (généralement situés à l’échelle de l’individu) et pourrait donc avoir un potentiel important en terme de biomarqueurs. Il s’agit de trouver de nouvelles caractéristiques biologiques (des biomarqueurs) facilement mesurables permettant, par exemple, de détecter une maladie (dépis-tage médical) ou d’adapter le traitement à des caractéristiques propres à l’individu (médecine personnalisée).

Diverses approches permettent de caractériser le métabolome en mesurant simultanément un grand nombre de métabolites dans les fluides biologiques et les tissus. Parmi celles-ci, la spectro-métrie par résonance magnétique nucléaire (RMN) est une technologie haut-débit qui produit des spectres caractéristiques du mélange complexe de métabolites présents dans l’échantillon d’intérêt. Parmi les technologies haut-débit, la RMN est relativement peu coûteuse et suscite donc des espoirs pour la recherche efficace de nouveaux biomarqueurs. Cependant, l’interpré-tation biologique des spectres obtenus est difficile car les spectres ne donnent pas une mesure explicite des différentes quantités de métabolites présentes dans l’échantillon.

Aussi, traditionnellement, l’analyse du métabolome obtenu par RNM est effectué de la manière suivante : tous les spectres sont divisés en petits intervalles appelés buckets. Ensuite, l’aire sous la courbe est calculée pour chacun de ces buckets et les analyses sont réalisées sur ces nouvelles variables. Ceci permet d’obtenir une liste de buckets d’intérêt (par exemple, buckets significativement différents entre deux conditions d’étude). L’identification des métabolites sous-jacents nécessite l’aide d’un expert en RMN ; ce qui rend cette étape fastidieuse, longue et subjective.

(3)

Une approche alternative prometteuse consiste donc à identifier et quantifier les métabolites présents dans le mélange complexe à partir de son spectre et à réaliser l’analyse statistique sur les résultats de cette quantification. Quelques outils existant permettent de quantifier des métabolites à partir d’un spectre RMN (Autofit [5], batman [1], Bayesil [3]). Toutefois, Autofit est inclus dans un logiciel commercial, batman est très coûteux en temps de calcul et Bayesil n’est disponible qu’à travers une interface web qui n’est pas adaptée pour quantifier plusieurs spectres simultanément.

Pour améliorer la quantification du métabolome et faciliter son analyse statistique, nous avons développé un nouveau package R, ASICS (Automatic Statistical Identification in Complex Spectra). Ce package, disponible sur Bioconductor, propose un pipeline complet d’analyse de spectres RMN. Il contient une méthode statistique d’identification et de quantification de mé-tabolites dans un mélange complexe basé sur une librairie de spectres de références (spectres obtenus à partir de chaque métabolite pur) [2, 4]. Une librairie de 191 spectres de métabolites purs est incluse dans le package. Elle peut être complétée, réduite ou remplacée par des spectres de référence de l’utilisateur si besoin. Les spectres à analyser peuvent être importés depuis des fichiers bruts de type Bruker grâce à une fonction dédiée. Cette importation inclut des pré-traitements standards comme une correction de la ligne de base, un alignement des pics, qui utilise des informations provenant de l’ensemble des spectres, et une normalisation. À partir des spectres importés, une fonction identifie et quantifie les métabolites présents. Enfin, des analyses statistiques (ACP, OPLS-DA et tests statistiques) peuvent être réalisées directement sur les résultats de la quantification. Le package inclut enfin divers outils diagnositiques permet-tant d’évaluer la qualité de la quantification ou la concordance avec les résultats de l’approche traditionnelle utilisant les buckets.

Les performances de ASICS ont été comparées à celles des approches concurrentes sur un mélange complexe synthétique de 21 métabolites [4] ainsi que sur des données réelles issues du projet PORCINET (ANR-09-GENM-005) pour lequel des dosages directs ont été pratiqués en même temps que l’analyse RNM du métabolome [2]. ASICS montre des performances meilleures que ses concurrents en terme d’identification, avec une bonne sensibilité et une bonne spécificité pour un temps de calcul réduit. Les quantifications obtenues sont bien corrélées aux dosages réels et les analyses pratiquées sur les résultats de la quantification permettent de retrouver de manière simple et automatisée les résultats des analyses pratiquées sur les buckets.

Sur les données du projet PORCINET, ASICS permet aussi de mettre en évidence les voies métaboliques impliquées dans la maturité des porcelets : à 90 jours de gestation les métabo-lites nécessaires à la prolifération cellulaire sont plus abondants qu’à 110 jours où ce sont les métabolites impliqués dans le métabolisme énergétique qui sont les plus abondants. De plus, des métabolites associés à ces voies comme le myo-inositol ou le glucose, ont des concentrations significativement différentes entre les deux races ce qui tendrait à expliquer des différences de maturité.

Références

[1] Hao, J., Astle, W., De Iorio, M., & Ebbels, T. M. D. (2012). BATMAN–an R package for the automated quantification of metabolites from nuclear magnetic resonance spectra using a Bayesian model. Bioinforma-tics, 28(15) :2088–2090.

[2] Lefort, G., Liaubet, L., Canlet, C., Tardivel, P., Père, M.-C., Quesnel, H., Paris, A., Iannuccelli, N., Vialaneix, N., & Servien, R. (2019). ASICS : an R package for a whole analysis workflow of 1D 1H NMR spectra. Bioinformatics.

(4)

I., Hu, X., Luchinat, C., Greiner, R., & Wishart, D. S. (2015). Accurate, Fully-Automated NMR Spectral Profiling for Metabolomics. PLOS ONE, 10(5) :e0124219.

[4] Tardivel, P., Canlet, C., Lefort, G., Tremblay-Franco, M., Debrauwer, L., Concordet, D., & Servien, R. (2017). ASICS : an automatic method for identification and quantification of metabolites in complex 1D 1H NMR spectra. Metabolomics, 13(10) :109.

[5] Weljie, A. M., Newton, J., Mercier, P., Carlson, E., & Slupsky, C. M. (2006). Targeted Profiling : Quantitative Analysis of 1 H NMR Metabolomics Data. Analytical Chemistry, 78(13) :4430–4442.

Références

Documents relatifs

On retrouve la creatine, non seulement dans le muscle mais aussi dans le sang, et une faible quantité de creatine est constamment excrétée dans les urines.. D'après Yasuda (3),

Le but de cette application est d’accompagner l’élève dans la résolution d’un spectre RMN, en lui donnant des indices spécifiques de chaque étape de résolution..

Au XVIII e siècle, cette technique utilisant de la cire d’abeille comme liant, était en plein essor et de nombreux faussaires l’utilisèrent pour réaliser de fausses œuvres

Partant de ces deux propri´ et´ es, un spectre de la librairie de r´ ef´ erence est gard´ e si tous ses pics sont pr´ esents dans le m´ elange complexe avec un d´ ecalage maximal de

Hauteur des courbes d’intégration = proportionnelle au nombre d’atomes équivalent dans chacun des groupes.. Tableau des déplacements chimiques : indication sur le type

— Dans [8], les auteurs ont construit une résolution injective minimale d’un module instable dans la catégorie des modules instables modulo 2.. A partir de cette résolution,

En mécanique quantique, l'état d'un système peut être représenté par un vecteur dans un espace aux propriétés particulières, appelé espace de Hilbert.. Les propriétés

Une approche alternative prometteuse consiste donc à identifier et quantifier les métabolites présents dans le mélange complexe à partir de son spectre et à réaliser