• Aucun résultat trouvé

Les méthodes de marquage par isotopes stables pour la quantification des protéines par spectrométrie de masse

Zone libre de champ

Chapitre 3 Les stratégies de quantification en analyse protéomique

3. Les méthodes de marquage par isotopes stables pour la quantification des protéines par spectrométrie de masse

Les approches de marquage aux isotopes stables sont basées sur la dilution isotopique. Elle s’appuie donc sur le fait qu’un peptide marqué avec des isotopes stables présente les mêmes propriétés physico-chimiques que son homologue non marqué et ne diffère que par sa masse moléculaire. Il présentera donc les mêmes comportements en chromatographie et en spectrométrie de masse [9]. Il existe différentes techniques de marquages aux isotopes stables. Une d’entre elle est une approche ciblée utilisant des peptides de synthèse marqués qui sont ajoutés à l’échantillon. Elle permet la quantification absolue par une technique de spectrométrie de masse appelée SRM (« Selective Reaction Monitoring »). Les autres techniques permettent la quantification relative globale entre différentes conditions biologiques [222-224] et diffèrent par le mode d’introduction du marquage [188]. On distingue alors :

Le marquage métabolique ou in situ [225] qui consiste à effectuer le marquage au niveau des cellules en les cultivant dans un milieu enrichi en isotope stable.

 Le marquage par réaction enzymatique réalisé au niveau des peptides. L’incorporation des isotopes stables s’effectue par digestion enzymatique dans de l’eau lourde (H218O).

 Le marquage chimique réalisé par dérivation chimique des protéines ou des peptides. 3.1. Le marquage métabolique

Dans cette approche, les isotopes stables sont incorporés dans les protéines des organismes à l’aide de milieu de culture ou de la nourriture marqué aux isotopes stables. C’est donc à l’étape la plus en amont possible que le marquage est effectué. Ceci permet à toutes les protéines produites dans l’organisme étudié d’incorporer le marquage et donc de fournir un standard interne pour chaque protéine et peptide dans l’échantillon biologique. Lorsque les tissus ou cellules des organismes cultivés dans des milieux lourds et légers sont mélangés en quantité égale puis traités ensemble de la même façon, toutes les causes techniques de variabilité et de non-reproductibilité dues aux traitements tels que la lyse des cellules, l’extraction des protéines et la digestion enzymatique sont éliminées [225].

La technique de marquage métabolique la plus connue a été introduite par le groupe de Matthias Mann en 2002 [226] et consiste à utiliser un milieu de culture enrichi en acides aminés marqués aux isotopes stables. Cette approche est connue sous le nom SILAC (« Stable Isotope Labelling by Amino-acids in Cell culture »). L’acide aminé qui sert pour le marquage peut être choisi parmi les acides aminés essentiels, qui ne peuvent être synthétisés de novo, et ceci pour une incorporation plus rapide et plus complète dans les protéines. Les acides aminés essentiels sont la lysine, la leucine, l’isoleucine, la phénylalanine, le tryptophane, la méthionine, la valine et la thréonine. Normalement c’est la leucine et la lysine sont les acides aminés les plus utilisés étant donné leur abondance naturelle favorable dans les protéines. Cependant, l’utilisation simultanée de la lysine et

l’arginine marquées permet d’obtenir un marquage de tous les peptides trypsiques excepté le peptide C-terminal. L’arginine n’est pas un acide aminé essentiel mais plusieurs équipes ont montré son incorporation complète [227-232]. Après mélange et digestion enzymatique, les peptides sont analysés en LC-MS/MS. Les peptides marqués coéluent en chromatographie avec leurs homologues non marqués. L’identification d’un des peptides lourds ou légers permet l’identification d’une protéine. La quantification est effectuée en extrayant les courants d’ions de chaque paire de peptides et en calculant le ratio d’intensité (Figure 2–A).

Une autre approche applicable aux organismes capables de croître avec une alimentation contenant exclusivement des nutriments marqués aux isotopes stables a aussi été décrite (Figure 2–B). Généralement c’est l’azote 15N [233] qui est utilisé puisque c’est un atome moins abondant dans les peptides que le carbone, mais le 13C et 18O ont aussi été utilisés [225]. Cette stratégie a été appliquée avec succès sur plusieurs organismes telle que la levure [202], les plantes [234], la drosophile [235] ou encore le rat [236]. Bien qu’une substitution presque totale des atomes naturels par leurs isotopes a pu être obtenue [225], cette approche est très difficile à mettre en œuvre et demande beaucoup de temps et de ressources. De plus, le nombre d’isotopes incorporés est dépendant de la séquence du peptide (par exemple du nombre d’azote dans un peptide donné) et donc l’analyse des données générées par cette approche s’avère plus compliquée [233,237,238] que dans l’approche SILAC où le nombre de label isotopique est défini (1 acide aminé 13C6-Arg ou 13C6 -Lys). Par conséquent, SILAC reste la technique la plus utilisée du marquage métaboliques chez les eucaryotes et les organismes supérieurs en culture cellulaire [188].

Figure 2 : Marquage métabolique des protéines in situ et quantification : A- par la méthode SILAC utilisant des milieux de culture contenant des acides aminés marqués aux isotopes stable, B- par marquage métabolique total au 15N en utilisant des nutriments enrichi en 15N (adaptée de [225]).

Milieu contenant des Arg et Lys naturelles

Milieu contenant des Arg et Lys marquées au 13C6

Mélange des tissus ou extraction des protéines puis mélange

Digestion enzymatique

Analyse en MS et identification MS/MS

Extraction des courants d’ions des peptides

quantification des protéines à l’aide des ratios des peptides lourds et légers Condition biologique 1 Condition biologique 2 SILAC Inten si Inten si m/z Temps Lourd Lourd Léger Léger Nourriture contenant de l’azote naturelle Nourriture contenant de l’azote 15N

Mélange des tissus ou cellules puis extraction

des protéines

Digestion enzymatique

Analyse en MS et identification MS/MS

Extraction des courants d’ions des peptides

quantification des protéines à l’aide des ratios des peptides lourds (15N) et légers Condition biologique 1 Condition biologique 2 Marquage métabolique total au 15N Inten si Inten si m/z Temps Lourd Léger Léger Lourd A B

Le marquage métabolique, et plus particulièrement l’approche SILAC, est considéré comme étant la méthode la plus précise de quantification relative et globale par spectrométrie de masse. Ceci est due à l’introduction du marquage dans l’étape la plus en amont possible permettant de s’affranchir des variabilités techniques [188,238]. Elle est bien adaptée à l’étude de variations de l’abondance des protéines, des modifications post-traductionnelles [229,230,239,240] et des interactions protéine-protéine [241]. Néanmoins, pour les modifications post-traductionnelles, la quantification est effectuée seulement au niveau des peptides et donc s’appuie sur une seule observation (par opposition à la quantification des protéines qui utilise plusieurs peptides pour quantifier une protéine) ce qui rend la validation statistique des résultats difficile [188]. De plus, le marquage métabolique présente quelques limitations. La première étant le nombre restreint de marquage possible ce qui limite donc le nombre de conditions biologiques comparables dans une expérience (maximum 3 pour SILAC [242]). D’autre part, si certaines lignées cellulaires incorporent relativement facilement les acides aminés lourds, d’autres sont très sensibles au milieu de culture et ne permettent pas le marquage métabolique ou bien requièrent une attention particulière [188]. Un des exemples cités dans les revues est celui de la conversion de l’excès d’arginine en proline ce qui complique l’interprétation des résultats. Dans ce cas-là, un contrôle de la quantité d’arginine dans le milieu de culture est nécessaire [227]. Néanmoins, une solution à ce problème a été proposée. Elle consiste à utiliser de l’arginine

15

N4 à la place de l’arginine légère (naturelle) et de la [15C6, 15N1]-arginine en tant qu’arginine lourde [243]. De cette façon, la conversion de l’arginine conduira à la formation de 15N1 -proline et [15C5, 15N]-proline respectivement. Ainsi le taux de conversion peut être déterminé d’une façon précise et un facteur de correction peut être calculé.

3.2. Le marquage par réaction enzymatique

Dans cette méthode, le marquage est effectué par l’incorporation d’un ou deux atomes d’18O par la réaction enzymatique d’une protéase dans de l’eau lourde H218O [244] permettant ainsi le déplacement de la masse du peptide marqué de 2 ou 4 Da. Le nombre d’atomes d’oxygène lourds incorporés dépend de la protéase utilisée. Un déplacement de 2 Da est généralement insuffisant pour différencier les enveloppes isotopiques des isotopomères. La trypsine et la Glu C permettent d’introduire 2 atomes 18O et sont donc préférées à la LysN et aux autres enzymes qui n’introduisent qu’un seul atome d’oxygène lourd [245]. En effet, dans de l’eau lourde et lors du clivage de la liaison peptidique par la trypsine ou la GluC, un 18O est échangé sur le groupement hydroxyl et un autre sur le carbonyl de l’extrémité C-terminale du peptide [225]. Vue la nature enzymatique de la réaction de marquage, les réactions secondaires non spécifiques sont évitées [188]. A des pHs extrêmes, l’isotope lourd est rechangé [246] mais dans les conditions classiques utilisées en spectrométrie de masse, le marquage est relativement stable. Le marquage enzymatique peut être effectué avec de faibles quantités de matériel et est compatible avec pratiquement tous les types de préparation d’échantillon. Cependant, étant réalisé au niveau des peptides, des variabilités techniques peuvent être observés puisque les échantillons à comparer sont traités séparément dans les étapes précédant le marquage. En

plus du déplacement relativement faible de la masse par le marquage, un autre inconvénient de cette technique est que la réaction de marquage est très souvent incomplète et des incorporations différentielles entre peptides de 18O ont été observées compliquant ainsi l’interprétation des données [247,248]. Les limitations de cette technique sont détaillées dans une revue de Ye et Coll. [249].

3.3. Le marquage chimique

Le marquage chimique consiste à modifier chimiquement les protéines ou les peptides à l’aide d’un réactif qui est marqué ou non aux isotopes stables. Tous les groupements réactifs des chaînes latérales des acides aminés (thiols, amines, carboxyles) peuvent servir comme site de dérivation. Ainsi, il existe un grand nombre de réactifs chimiques permettant d’effectuer ce genre de marquage. En pratique, la dérivation est souvent effectuée sur les groupements amines des lysines (et des amines N-terminales) ou sur les groupements thiols des cystéines. Les techniques de marquage chimique peuvent être classées en deux catégories : le marquage isotopique et le marquage isobarique.

3.3.1. Le marquage isotopique

Cette technique consiste à utiliser une forme lourde et une forme légère du réactif de marquage afin de marquer in vitro séparément les échantillons. Les échantillons modifiés chimiquement sont ensuite mélangés et analyser simultanément en LC-MS/MS comme dans le cas du marquage métabolique. Les rapports d’intensité entre peptides marqués lourd et léger sont utilisés pour la quantification (Figure 3). Il est préférable que la différence de masse entre la forme lourde et la forme légère soit supérieure à 4 Da pour permettre de bien distinguer les massifs isotopiques [9].

Figure 3 : Illustration de la quantification relative à l’aide du marquage chimique isotopique in vitro (adaptée de [225]).

Une des premières stratégies de marquage isotopique fut ICAT (« Isotope-Coded Affinity Tag ») introduite par Gygi et al. [222]. Dans cette stratégie les groupements thiols des cystéines sont dérivés en milieu réducteur à l’aide du réactif ICAT lourd (avec 8 deutériums) ou léger. Après cette modification chimique, les protéines sont mélangées et digérées. Les peptides marqués sont ensuite enrichis sur une colonne avidine à l’aide du groupement biotine contenu dans le réactif de dérivation [250] puis analysés par spectrométrie de masse. L’enrichissement des peptides marqués à l’aide de ce réactif représente un des avantages majeurs de cette technique. Cependant, elle est limitée aux protéines contenant des cystéines qui sont des acides aminés relativement rares (1,82 %).

2 conditions biologiques

Extraction des protéines

Dérivation chimique des protéines Analyse par MS Quantification à l’aide du ratio lourd/léger des peptides marqués Mélange puis digestion enzymatique Intens ité Réactif léger Réactif lourd Léger Lourd

De plus, elle est restreinte à la comparaison de seulement deux conditions biologiques [225]. Plusieurs variantes du réactif ICAT ont été développées à partir du réactif d’origine visant à améliorer l’enrichissement des peptides marqués et leur co-élution [251-253]. En effet, des petites différences de temps de rétention sont souvent observées entre les peptides deutérés et leurs homologues non deutérés en HPLC phase inverse [197]. Ceci complique l’analyse des données puisque la quantification relative des peptides ne peut plus être effectuée sur un spectre et la fenêtre de temps de rétention doit être élargie en conséquence ce qui peut induire des problèmes d’interférence avec d’autres espèces [188]. Ceci a conduit à l’utilisation du 13C et du 15N qui eux n’altèrent pas la coélution. De plus, le tag biotinylé utilisé pour l’enrichissement est devenu clivable en milieu acide ce qui simplifie l’analyse des spectres MS/MS, cette amélioration fut baptisée cICAT (« cleavable ICAT »)[254].

Une autre approche appelée ICPL (« Isotope-Coded Protéine Label ») [255] consiste à modifier les fonctions amines des lysines et des extrémités N-terminales. Cette technique permet d’obtenir plus de peptides modifiés (la lysine étant un acide aminé abondant), et élargit le nombre de peptides utilisés pour la quantification. Cependant, lorsque le marquage est effectué au niveau protéique, la trypsine ne coupe plus les lysines modifiées ce qui conduit à l’obtention de peptides de grande taille difficiles à analyser en MS.

En générale, les approches par marquage isotopique sont bien adaptées à la quantification relative globale des protéines et sont assez versatiles, cependant elles présentent certaines limitations. Le rendement du marquage est un paramètre important pour l’obtention d’une quantification fiable. De plus, des réactions parasites peuvent être observées conduisant à des marquages non spécifiques ayant des effets indésirables sur la fiabilité de la quantification et sur l’interprétation des données [188].

3.3.2. Le marquage isobarique

Cette technique consiste à marquer les amines N-terminales des peptides avec des réactifs isobariques qui ont la même masse mais dont la fragmentation génère des fragments spécifiques appelés ions reporteurs. Les peptides homologues ainsi marqués auront la même masse moléculaire et sont mélangés après marquage ; ils coéluront parfaitement en chromatographie. Un seul ion sera présent sur le spectre MS et un seul m/z sera donc isolé pour la fragmentation. La quantification se fait donc à l’aide des rapports d’intensité MS/MS des ions reporteurs. Ces ions reporteurs ont des faibles m/z (de 114 à 118) évitant ainsi l’interférence avec les fragments du squelette peptidique [9]. L’approche la

plus connue est l’approche « iTRAQ » (« isobaric Tag for Relative and

Absolute Quantification ») [256] (Figure 4). Dans sa version commerciale, elle permet de réaliser simultanément la quantification relative de 8 échantillons grâce à 8 réactifs isobariques [257]. Ceci est particulièrement intéressant pour l’étude de l’évolution d’un système biologique à différents points dans le temps ou plus généralement pour comparer différents traitements ou conditions biologiques dans une même expérience. Une autre

approche similaire appelée TMT (« Tandem Mass Tag ») a été décrite [258] et est aussi commercialisée.

Figure 4 : Stratégie de marquage isobarique, après digestion enzymatique, les amines N-terminales des peptides sont marquées avec des réactifs isobariques, puis les échantillons sont mélangés et analysés par LC-MS/MS en mode DDA. Les spectres MS/MS ainsi générés permettent l’identification des peptides et la quantification relative se fait à l’aide des ions reporteurs (adaptée de [225]).

Dans cette approche, la précision de la quantification dépend largement de la fenêtre d’isolation des ions à fragmenter puisque tous les ions dans cette fenêtre contribueront à la génération d’ions reporteurs. Un des inconvénients de cette technique est que la dérivation se fait au niveau peptidique, et donc toutes les variabilités en amont de la digestion ne sont pas prises en compte pour la quantification.

3.4. Quantification absolue ciblée avec les stratégies de dilution isotopique L’utilisation de peptides de synthèse marqués aux isotopes stables en tant qu’étalons pour la quantification par spectrométrie de masse remonte à l’année 1983 et a été publié par Desiderio et al. [259]. Récemment, et avec les avancées en analyse protéomique, cette approche est utilisée pour la quantification absolue et est connue sous la dénomination AQUA pour « Absolute QUAntification » [260]. Contrairement aux approches de quantification globale décrites ci-dessus, il est indispensable de déterminer les protéines cibles avant d’aborder la quantification. Les peptides synthétique de référence sont choisis en fonction de la ou des protéine(s) d’intérêt à quantifier. La stratégie la plus simple consiste à ajouter des quantités connues de peptides synthétiques marqués à un digest de protéines et de comparer les intensités de ces peptides marqués avec celles de leurs homologues endogènes. Bien qu’ils soient onéreux, la disponibilité des peptides AQUA dans le commerce avec des puretés élevées a rendu cette approche attractive dans le cadre de l’analyse et de la validation de biomarqueurs potentiels d’intérêt clinique [261]. Le principal inconvénient de cette approche est que, dans le cadre d’une analyse protéomique, les échantillons sont très complexes et il y a un risque de coélution de peptides isobariques ou de masses très proches qui viennent fausser la quantification. Le choix des peptides étalons est aussi très importants, ces peptides doivent être protéotypiques de la protéine à quantifier et donc non partagés avec d’autres protéines issues du même protéome. De plus, il est difficile de déterminer la quantité d’étalon à ajouter lorsque la gamme dynamique des protéines est très étendue (10 ordres de grandeur pour les tissus sanguins). Les peptides de référence

Extraction des protéines

Digestion enzymatique

Mélange des peptides puis analyse par MS

Identification des peptides par MS/MS

Dérivation chimique des peptides avec des

réactifs isobariques In ten si In ten si In ten si Quantification à l’aide des ratios des ions reporteurs

étant ajoutés après la digestion enzymatique, des variabilités dues à la préparation d’échantillon peuvent être observées. Une stratégie qui consiste à exprimer une protéine chimérique marquée aux isotopes stables et contenant dans sa séquences des peptides concatémères des peptides à quantifier permet de surmonter ce dernier problème. Cette protéine chimérique peut être introduite plus tôt dans l’expérience (en amont de l’extraction des protéines) et donc limiter les variabilités dues aux étapes de fractionnement et de digestion. Cette stratégie fut introduite par Pratt et al. sous le nom « QconCAT » (« Quantification conCATemer ») [262]. Toutefois, Rivers et al. ont observé que les rendements de digestion de ces protéines chimériques QconCAT sont différents de ceux des protéines cibles endogènes [263]. Une autre alternative est la stratégie « PSAQ » (« Protein Standard Absolute Quantification ») qui consiste à utiliser une protéine recombinante, ayant des peptides marqués aux isotopes stables, et dont la séquence en acides aminés est identique à celle de la protéine d’intérêt [264]. La mise en œuvre de ces stratégies reste néanmoins difficile et onéreuse.

3.5. La quantification absolue combinant la dilution isotopique à la SRM

La méthode de quantification absolue alliant spécificité, gamme dynamique et sensibilité reste la combinaison de la stratégie de dilution isotopique avec la SRM (« Selected Réaction Monitoring ») à l’aide d’un spectromètre de masse de type triple quadripôle. Cette méthode est depuis longtemps utilisée pour l’analyse et la quantification de petites molécules notamment dans des applications cliniques. Cependant, l’analyse ciblée des protéines par SRM se distingue de celles des petites molécules par plusieurs aspects dont le plus important est que l’analyse ne se fait pas directement sur les protéines et nécessite de passer par une digestion enzymatique. La quantification des protéines est donc effectuée au niveau des peptides. De ce fait, le passage par plusieurs étapes de préparation est nécessaire afin de produire et sélectionner ces peptides indispensables à l’analyse. Les autres aspects qui distinguent la quantification des protéines par SRM sont la complexité et la gamme dynamique du protéome. A ceci s’ajoute le fait que, dans le cas de la protéomique quantitative, la matrice et les analytes sont de même nature, à savoir des peptides ce qui entraine des risques en termes d’interférences, de suppression d’ions et de limite de détection [265].

Typiquement, dans une analyse SRM, une liste des peptides protéotypiques est définie. Les peptides protéotypiques d’une protéine sont des peptides dont la séquence n’est partagée avec aucune autre protéine susceptible d’être présente dans le mélange à analyser. Ce sont les ions correspondants à ces peptides qui seront sélectionnés par le premier quadrupôle pour être analysés par la suite. L’ion précurseur ainsi sélectionné sera fragmenté en mode CID dans la cellule de collision puis un ou plusieurs fragments seront