• Aucun résultat trouvé

CHAPITRE 1 : INTRODUCTION GENERALE

2. La métabolomique

2.2. L’analyse métabolomique : une approche chimiométrique

La métabolomique associe l’utilisation des techniques de spectroscopie à des outils statistiques pour l’identification de métabolites significativement modifiés entre des groupes d’individus.

On distingue la métabolomique non ciblée, qui est la technologie haut-débit correspondant à une analyse globale de toutes les molécules présentes dans un échantillon (à des concentrations mesurables), incluant des molécules inconnues à l’heure actuelle, et la métabolomique ciblée, qui permet la mesure de groupes de métabolites spécifiques, caractérisés et appartenant à une même voie métabolique (comme les lipides, les acides aminés ou les stéroïdes). L’identification de nombreux métabolites nécessite l’utilisation de stratégies complexes d’analyse statistique des données pour tenir compte des différents cofacteurs d’influence (Chen et al. 2006 ; Clarke and Haselden 2008). On nomme chimiométrie l’association des techniques d’acquisition spectrale et des techniques statistiques employées.

L’obtention d’un profil métabolique équivaut à l’obtention d’un spectre qui peut être acquis grâce à l’aide de diverses techniques analytiques de spectroscopie. Aujourd’hui, la résonnance magnétique nucléaire (RMN) et la spectrométrie de masse (SM) sont les techniques les plus utilisées. Le principal avantage de la RMN est la simplicité de préparation de l’échantillon, l’adaptabilité de la méthode à des techniques haut-débit et la capacité à offrir une empreinte métabolique quantitative. Elle a été largement privilégiée pour les études à large échelle, lorsque l’objectif était d’identifier des métabolites discriminants entre différents groupes de population. La principale limite de la RMN est sa faible sensibilité comparée à d’autres techniques analytiques conduisant à des limites de détection plus

les quantités sont globalement importantes par rapport aux limites de quantification actuelles (quelques millimolaires versus un micromolaire), cela le devient pour la détection de xénobiotiques à l’état de traces, ou de composés endogènes faiblement concentrés comme les hormones. Ainsi la SM devient une technique de choix depuis le développement de la SM haute résolution (HRMS). Couplée à des techniques de séparation comme la chromatographie liquide ou gazeuse et l’électrophorèse capillaire, la SM permet de gagner en précision (Breitling et al. 2006), en détectant des molécules non observables avec la technique de RMN. Ces développements sont à l’origine de la large utilisation de la SM dans la recherche de biomarqueurs et pour l’identification d’empreintes métaboliques à l’heure actuelle (Werner et al. 2008). Néanmoins, la SM possède également des inconvénients pour l’analyse de fluides biologiques (Combourieu 2007). En particulier, la quantification précise n’est pas applicable à un profilage complet du fait de la nécessité de disposer de standards internes. D’autres techniques moins répandues existent. Ainsi la spectroscopie optique (infra-rouge ou Raman) peut être utilisée en raison de la simplicité de préparation des échantillons. Chacune de ces techniques possèdent donc des avantages et des inconvénients repris, pour les principales (RMN et SM) dans le tableau 2.

Tableau 2 : Comparaison de la spectrométrie de masse et de la résonance magnétique nucléaire pour le profilage métabolique

Spectrométrie de masse (SM)

Résonance magnétique nucléaire (RMN)

Objectifs

Etude des flux métaboliques dynamiques (réseaux métaboliques) = évolution temporelle sur un même individu (bonne

sensibilité), caractérisation et identification de biomarqueurs

Etude à large échelle en vue de discriminer des groupes de population ;

automatisation, haut débit, bonne reproductibilité (Horgan et al. 2009)

Préparation des échantillons

Filtration ; séparation (LC, GC) conseillée

pour éliminer les effets de matrice Dilution ; ± solution tampon Quantités nécessaires

à l’injection 10-15 µL 200 à 500 µL (plasma/ urine) Temps d’analyse 20 - 50 min (Clarke and Haselden 2008)

10 min (Clarke and Haselden 2008), possibilité d’avoir un passeur

automatique

Avantages

Analyse non ciblée, haute résolution Meilleure sensibilité (LD = 10-12 M)(Clarke and Haselden 2008) : permet de détecter des petits groupements comme sulfates,

amines, groupes carboxyles Plus d’information sur la caractérisation

des biomarqueurs

Analyse non ciblée, bonne reproductibilité (absence de dérive du

signal)

Analyses statistiques plus solides pour l’identification de groupes contrastés

(Beckonert et al. 2007) Bonne précision quantitative (aire des

pics directement proportionnelle à la concentration)

Plus rapide que la SM (un seul passage par échantillon)

Inconvénients

Analyse restreinte par la préparation des échantillons (filtration, molécules non

ionisables…)

Effets de matrice qui engendre une grande variabilité du signal (dérive)

Répétabilité 15-30 % Problèmes d’étalonnage interne Semi-quantitatif et moins rapide (plusieurs passages, différents modes)

Moins bonne sensibilité (10-5 M) (Clarke and Haselden 2008 ; Dumas et al. 2006) Plus adapté à l’identification de profils métaboliques entre divers groupes de population (exploitation statistique) mais moins adapté pour générer des hypothèses mécanistiques / réseaux métaboliques (données manquantes)

Sources : Canlet C., Cravédi J.P., Jourdan F., Antignac J.P. Communications personnelles, février - mars 2009.

Le choix de l’une ou de l’autre méthode est souvent dicté par un compromis entre les objectifs à atteindre (identification d’une empreinte ou de métabolites discriminants, sensibilité, reproductibilité, quantification, réseaux métaboliques) et la faisabilité technique (ressources, temps, financements).

et la SM peuvent être utilisées de manière complémentaire pour maximiser les chances d’identifier et de quantifier le plus de métabolites possibles (Clarke and Haselden 2008). Chan et al. ont comparé les deux approches dans le cas du profilage métabolique de cellules cancéreuses (cancer colo-rectal) et de cellules normales (mucus colo-rectal). Leurs travaux indiquent que la RMN et la SM sont deux techniques intéressantes (car discriminantes) et complémentaires (Chan et al. 2009). En effet, 31 marqueurs métaboliques ont pu être mis en évidence, dont un tiers grâce à la RMN (composés contenant de la choline, lactate, taurine, lipide totaux, scyllo-inositol, glycine) et deux tiers grâce à la SM (différentes classes d’acides gras, prostaglandines, uridine, phosphate, fumarate, malate, certains acides aminés, sucres). Seuls le lactate, la glycine et le glucose ont été mis en évidence à la fois avec les deux techniques.

La présentation des empreintes spectrales extraites sous un format exploitable pour l’analyse statistique nécessite une étape de prétraitement des données, qui comprend généralement l’alignement des empreintes des différents échantillons étudiés, la réduction du bruit de fond et la normalisation des données, et en fonction des techniques analytiques

utilisées, des procédures de déconvolution8, de choix des pics d’intérêt, ou de bucketing9.

Enfin, l’une des dernières étapes concerne la standardisation des données pour que toutes les variables aient le même poids, quelle que soit leur variance.

Dans les données spectrales, les variables utilisées ne sont pas directement les métabolites mais des signaux, qui sont largement corrélés entre eux car pouvant appartenir à la même molécule. Par exemple, en RMN du proton, un signal présent à un déplacement chimique donné correspond à la quantité de proton ayant le même environnement chimique et est proportionnel à la concentration de la molécule à laquelle appartient le (ou les) proton(s) en question. Ce signal est donc corrélé à tous les autres signaux du spectre correspondant aux

autres protons de la même molécule. La figure 6 montre l’exemple du spectre RMN 1H de

l’acide hippurique, où les signaux à 3,97 ppm, 7,53 ppm, 7,62 ppm et 7,82 ppm

8

« Extraction, par un procédé mathématique, d’un signal d’une matrice complexe afin d’obtenir des spectres de masse épurés » (Allibe-Signorini et al. 2008).

correspondent tous à des protons de la même molécule. Ces signaux sont donc corrélés entre eux.

Figure 6 : Spectre RMN 1H de l’acide hippurique.

De ce fait, les techniques statistiques classiques (régression des moindres carrés ordinaires par exemple) ne peuvent pas être appliquées aux données de métabolomique, d’autant que le nombre de variables est largement supérieur au nombre d’observations. Ce sont donc des méthodes multivariées (analyse en composantes principales – ACP, régression partial least squares – PLS par exemple) qui sont plutôt utilisées (Chen et al. 2006 ; Clarke and Haselden 2008). La PLS est l’une des techniques les plus employée jusqu’à maintenant. Il s’agit d’une méthode multivariée de réduction de la dimensionnalité où un petit nombre de variables latentes (combinaisons linéaires des variables initiales) est calculée selon un critère d’optimisation.

L’identification des métabolites joue ensuite un rôle important dans l’interprétation des données de métabolomique. Généralement elle se fait à partir de bases de données spectrales disponibles sur internet. Une revue de l’ensemble de ces méthodes (prétraitement des données, analyses statistiques et identification des métabolites) est présentée dans le chapitre 3.

2.3.

Les facteurs de variation des empreintes métaboliques chez