• Aucun résultat trouvé

Zone libre de champ

Chapitre 3 Les stratégies de quantification en analyse protéomique

2. Les méthodes sans marquage (« Label Free »)

Les méthodes dites « Label Free » sont des méthodes de quantification relative reposant sur des données spectrales et n’impliquant aucun marquage. Deux principales stratégies peuvent être distinguées, la première est basée sur la comparaison des intensités des signaux MS des peptides tandis que la deuxième est basée sur le comptage des spectres MS/MS (« Spectral counting »).

2.1. La quantification basée sur la comparaison des intensités des signaux MS Dans cette stratégie, les échantillons à comparer sont analysés séparément. Après identification des peptides, les courants d’ions de chaque peptide sont extraits et les aires des pics chromatographiques correspondants sont intégrées. Les valeurs obtenues pour l’ensemble des peptides issus d’une même protéine sont comparées à celles obtenues dans une ou plusieurs analyses. Ainsi les rapports des aires des pics de peptides correspondant à une protéine donnée dans différentes conditions permettent d’avoir des informations sur son abondance relative [196-200]. Ceci peut être réalisé à partir d’analyses en LC-MS ou en LC-MS/MS. Dans ce dernier cas, un ajustement entre la fréquence d’acquisition des spectres MS et MS/MS doit être réalisé. En effet, si le séquençage d’un maximum de peptides par MS/MS est requis pour obtenir un plus grand nombre de protéines identifiées, une quantification robuste par intégration des aires des pics chromatographiques nécessite un nombre suffisant de spectre MS pour bien décrire ces pics chromatographiques (idéalement au moins 9 points par pic) [188]. Ainsi, même avec les instruments présentant la meilleure performance en termes de vitesse d’acquisition, la quantification la plus juste est obtenue au détriment du nombre d’indentifications des protéines présentes et inversement.

Une autre approche appelée « Accurate Mass and Time tag » (AMT) [201] consiste à effectuer la LC-MS et la LC-MS/MS séparément. Ainsi l’analyse en LC-MS/MS sert à identifier le maximum de peptides et par suite des protéines. Elle permet de constituer une large banque d’identification des peptides définis par leur séquence, leur rapport m/z et leur temps de rétention. La quantification est ensuite réalisée lors de l’analyse LC-MS. L’échantillonnage des signaux des peptides intacts est optimisé. Les couples m/z et temps de

rétention dans la base AMT servent de coordonnées pour l’identification des peptides lors de la quantification. Une autre approche consiste à d’abord réaliser l’analyse LC-MS pour quantifier les espèces différentielles. Une analyse LC-MS/MS est ensuite réalisée afin d’identifier les peptides ainsi quantifiés en établissant des listes d’inclusion pour favoriser l’identification des espèces d’intérêt.

Il est évident que dans cette stratégie, la reproductibilité de la séparation chromatographique est critique et doit être optimisée afin que chaque peptide soit élué à un temps de rétention identique d’une analyse à l’autre. Des logiciels spécialisés sont souvent utilisés pour ajuster l’alignement des profils chromatographiques [188]. Il est aussi nécessaire d’utiliser des spectromètres de masse de haute résolution de type Q-TOF ou IT-Orbitrap afin d’éviter les problèmes de signaux parasites et de pouvoir extraire les courants d’ion avec une tolérance restreinte sur la fenêtre m/z. Un des principaux inconvénients de cette technique est les erreurs systématiques introduites par les variabilités dues à la préparation et à l’analyse séparée des échantillons à comparer. Cette variabilité peut être diminuée en introduisant des quantités fixes de protéines qui serviront de standards internes et permettront ainsi de normaliser les signaux.

2.2. La quantification « Spectral Counting » basée sur les données d’identification

Cette approche est basée sur l’observation empirique que, plus une protéine est concentrée dans un mélange donné, plus ces peptides vont être sélectionnés et fragmentés et donc un plus grand de spectres MS/MS seront associés à cette protéine. Par conséquent, la comparaison du nombre de spectre MS/MS associés à une protéine dans deux échantillons différents permet une quantification relative de cette protéine [202-205]. Cette approche utilise donc les données MS/MS à la fois pour identifier et pour quantifier contrairement à l’approche précédente qui était basée sur les données MS. L’approche « spectral counting » implique donc une réalisation d’un maximum de spectres MS/MS informatifs et de qualité afin de permettre une quantification robuste. En effet, il a été observé que la précision de la quantification est directement dépendante du nombre de spectres MS/MS considéré. Ainsi, il est possible de détecter une variation d’un facteur 3 dans l’abondance d’une protéine avec 4 ou 5 spectres, mais mettre en évidence une variation d’un facteur 2 requiert pas moins de 15 spectres [206]. Les spectromètres de masse de type trappe ionique (linéaire ou tridimensionnelle) sont privilégiés puisqu’ils présentent l’avantage de pourvoir enchainer les cycles de MS et de MS/MS à grande vitesse par rapport aux autres instruments tels que les Q-TOF. D’un autre coté, les paramètres d’exclusion dynamique couramment utilisés lors des analyses LC-MS/MS en mode données dépendant (DDA) doivent donc être adaptés.

Dans cette approche, le nombre de spectres des peptides est considéré comme un index de l’abondance des protéines [203,207,208]. Or un des biais envisagés est directement lié à la taille de la protéine. Les protéines de grande taille génèrent, par digestion

enzymatique, un nombre plus important de peptides et donc auront un plus grand nombre de spectres MS/MS. De plus, un faible nombre de spectres MS/MS peut avoir de multiples raisons telles qu’une protéine de séquence courte ou une faible détection par MS des peptides liée à leurs propriétés physico-chimiques et à la complexité de l’échantillon [209]. Le PAI (Protéine Abundance Index) [210] et plus tard le emPAI (Exponentially modified PAI) [211] ont été introduits pour permettre de corriger certains de ces biais. Ces index permettent de normaliser le nombre de peptides observés par rapport aux nombres de peptides théoriquement observables de la protéine d’intérêt. La normalisation peut être aussi réalisée en divisant le nombre de spectres MS/MS par la masse ou le nombre d’acides aminés de la protéine [212-214]. Ces normalisations permettent une correction assez satisfaisante de l’estimation des abondances relatives des protéines [215]. Cette méthode « Spectral Counting » a aussi été utilisé pour analyser des échantillons marqués aux isotopes stables [216].

Certains chercheurs, se basant sur la corrélation entre la quantité de protéines et le nombre de spectre ont proposé d’étendre l’utilisation de l’approche « Spectral Counting » à l’estimation des niveaux d’expression absolus des protéines. Ainsi, la connaissance de la quantité d’une ou de plusieurs protéines présentes dans les mélanges ou ajoutées en tant que standards internes permet d’estimer l’abondance absolue de l’ensemble des protéines du mélange étudié. Dans ce cadre, la technique APEX (Absolute Protein EXpression measurement) [217] a été proposée par Lu et coll. en 2007. Celle-ci prend en compte le nombre de peptides observés et la probabilité que les peptides soient détectés par le spectromètre de masse. Le facteur de correction Oi est ainsi une mesure de la probabilité d’observer un peptide trypsique au cours de l’analyse et est calculé en fonction de sa séquence et de ses propriétés physico-chimique. Ceci a été réalisé à l’aide d’algorithmes spécialisés qui sont éduqués à l’aide de données déjà existantes. Une combinaison de APEX à la LC-MSE et la SRM (selected reaction monitoring) a été récemment utilisée dans l’étude du protéome du pathogène Leptospira interrogans et a permis de réaliser la quantification absolue de 50% du protéome théorique de cette espèce [218].

En général, les stratégies de quantification « Label Free » présentent l’avantage, par rapport aux techniques impliquant des marquages, de ne pas être limitées en terme de nombre d’expériences, d’échantillons et de conditions biologiques à comparer. Elles fournissent aussi une gamme dynamique plus large pour la quantification. Toutefois, ces stratégies sont considérées comme étant moins précises car l’ensemble des variations accumulées dans les différentes étapes de la préparation d’échantillon et de l’analyse se répercute sur les données finales ; les échantillons étant traités individuellement contrairement aux expériences impliquant des marquages. Les stratégies « Label Free » ont été utilisées dans divers études pour explorer la dynamique de protéomes entiers dans le but de découvrir des biomarqueurs potentiels de pathologies [219,220] ou des voies de signalisation induites par un traitement [221].

3. Les méthodes de marquage par isotopes stables pour la quantification