• Aucun résultat trouvé

Chapitre 1 - Polyphénols et interactions polyphénol-protéine

5. De la protéomique à la protéomique chimique

5.1. La protéomique

La protéomique permet l’étude du protéome, c’est-à-dire l’étude de l’ensemble des protéines codées par un génome qui peuvent être exprimées et modifiées par un organisme vivant dans sa globalité, un tissu, une cellule ou un compartiment cellulaire pour un état physiologique et à un instant donné.115 Ces termes "protéomique" et "protéome" ont été proposés par Wilkins et al. au début des années 90 et reflètent les termes "génomique" et "génome" qui décrivent l’étude de la collection entière de gènes dans un organisme.70,116,117 De manière générale, l’approche protéomique consiste à séparer préalablement un mélange protéique complexe par une variété de techniques chromatographiques et/ou d'électrophorèse, à protéolyser éventuellement les protéines isolées et à les analyser par spectrométrie de masse avant leur identification.118,116 Cette analyse est devenue très performante grâce au développement de techniques séparatives et de nouvelles générations de spectromètres de masse associés à des outils de recherche bioinformatique et à la disponibilité de séquences génomiques et protéiques répertoriées dans de nombreuses bases de données.

En ce qui concerne les méthodologies mises en œuvre pour l’analyse d’un protéome, il existe deux stratégies d'analyse basées sur la Spectrométrie de Masse (SM) :119,120

- L’analyse dite "top-down" : après séparation des protéines, celles-ci sont étudiées sans protéolyse enzymatique préalable conduisant à une complexité réduite par rapport aux espèces présentes dans un protéolysat.119–121 Certaines études ont permis d’identifier jusqu’à 1 000 protéines intactes provenant d’échantillons complexes.122

- L’analyse dite "bottom-up" : la caractérisation des protéines se fait via l’analyse des peptides résultant de leur protéolyse. Cette méthode est l’approche la plus classique pour l’identification de protéines dans un mélange complexe et sera uniquement détaillée ci-après.112,119,123,124

5.1.1. Approche "bottom-up"

Dans l'approche "bottom-up", le mélange de protéines extraites de la cellule ou du tissu est soit directement clivé en solution à l'aide de protéases,125,126 le plus souvent la trypsine qui coupe ces protéines au niveau des résidus de lysine et d’arginine,127–130 soit les protéines sont préalablement séparées par des techniques d’électrophorèse (capillaire ou sur gel SDS-PAGE mono- ou bidimensionnel) et/ou des techniques de chromatographie (liquide ou d'affinité), la technique la plus couramment utilisée étant l’électrophorèse sur gel.112,118,131,132 Dans le premier

35

cas, la technique dite "shotgun" consiste à séparer le mélange complexe de peptides résultant par un système de chromatographie liquide couplé à l’analyse par SM.

Le "shotgun" a été rendu possible grâce aux évolutions de la SM. Ces avancées ont eu comme moteur les innovations dans le domaine de la mécanique, de l’électronique et de l’informatique permettant de développer des spectromètres de masse toujours plus performants. Nous mentionnerons, notamment, l’apparition des analyseurs de masse de type Orbitrap qui ont significativement amélioré la sensibilité des analyses protéomiques.133 En pratique dans cette approche, si le tampon d’extraction est compatible avec l’analyse en masse, le mélange de protéines extraites est directement protéolysé en solution et les peptides résultants sont analysés par chromatographie liquide associée à la spectrométrie de masse en tandem (LC-MS/MS en anglais). Si le tampon d’extraction n’est pas compatible avec l’analyse de masse ou s’il n’est pas dialysable, une étape de migration courte sur gel d’électrophorèse monodimensionnel permet d’éliminer la plupart des constituants préjudiciables à l’analyse. Les protéines ayant migrés mais non séparées sont alors protéolysées dans le gel et les peptides obtenus extraits et analysés. 134

Dans le second cas, les protéines sont préalablement séparées sur gel. Les taches d’intérêts observées après coloration sont découpées et protéolysées, les peptides obtenus d’une même protéine sont extraits puis séparés et analysés selon le même principe que précédemment.129,130

5.1.2. Analyse des peptides par SM

Les peptides générés de tailles spécifiques sont analysés par SM à l’aide d’un spectromètre de masse MALDI-TOF couplant une source d’ionisation laser assistée par une matrice (MALDI) et un analyseur à temps de vol (TOF) ou d’un spectromètre de masse ESI utilisant une source d’ionisation par électronébulisation (ElectroSpray). Ici, deux types d’analyses peuvent être sollicitées : une simple analyse SM dite de cartographie peptidique, appelée également "mass fingerprint",135 et/ou une analyse SM en tandem appelée TOF/TOF ou MS/MS en anglais.136 Cette dernière, en plus de déterminer la masse des peptides analysés, permet d’obtenir leur séquence en acides aminés apportant ainsi des informations complémentaires et augmentant la fiabilité de l’identification des protéines. Dans le cas de mélanges complexes, cette approche est la plus appropriée.

L’analyse par SM permet de mesurer la masse moléculaire d’un composé et d'obtenir également des données structurales. Ce type d’analyse mesure le rapport masse-sur-charge (m/z) d’une molécule ionisée et de ses fragments. La SM fournit des informations qualitatives et quantitatives sur la composition atomique et moléculaire.

36

Depuis plus d’une dizaine d’années, le développement de méthodes d’ionisation douce telles que l’ESI et le MALDI a permis l’essor de la SM dans le monde de la biologie. La SM est devenue une technique de référence dans l’identification des protéines, dans l’analyse fine de leurs séquences et de leurs éventuelles modifications post-traductionnelles. Les techniques d’ionisation ESI et MALDI couplées à des analyseurs de plus en plus résolutifs et de plus en plus sensibles rendent en effet possible l’analyse de quantités très faibles (quelques femtomoles à subfemtomoles) de produits.115,119,137,138

L’ionisation par électronébulisation (ESI)

Développée par le groupe de John B. Fenn (prix Nobel de Chimie en 2002), afin de permettre l’ionisation des macromolécules biologiques, l’électrospray ou électronébulisation est la technique d’ionisation la plus utilisée. Elle permet d’étudier des échantillons liquides et leurs évolutions en milieu biologique avec une grande sensibilité. De plus, elle peut être facilement couplée à des techniques séparatives (chromatographie liquide, électrophorèse capillaire). Mais la raison principale de son succès réside dans le fait que lors du processus d’électronébulisation, l’énergie interne ajoutée aux ions peut être contrôlée afin de ne pas entraîner de fragmentation moléculaire. Cette technique permet, par ailleurs, d’obtenir des ions multichargés, permettant alors d’analyser des composés biologiques de plus en plus lourds, de plus en plus complexes et avec une précision de mesure de masse remarquable.116,137,139

L’ionisation/désorption par laser assistée par une matrice et associée à un analyseur à temps de vol (MALDI- TOF)

La technique MALDI-TOF (Matrix-Assisted Laser Desorption/Ionisation – time-of-flight mass spectrometry) est basée également sur une source d’ionisation douce. Son introduction est due au travail de deux groupes, celui de Koichi Tanaka (prix Nobel de Chimie en 2002) et celui de Michael Karas et Franz Hillenkamp qui publièrent séparément en 1988 des travaux sur l’ionisation de molécules ayant des masses moléculaires supérieures à 100 000 Da.140,141

Aujourd’hui, elle est devenue une technique de choix pour l’étude de molécules de hauts poids moléculaires comme les biopolymères (peptides, protéines, oligonucléotides) et les polymères synthétiques. Elle est de ce fait très employée pour l’étude d’échantillons biologiques. Les spectres obtenus sont principalement composés d’ions monochargés accompagnés uniquement de quelques espèces di- ou tri-chargées ce qui simplifie l’analyse. La relative simplicité des spectres MALDI-TOF permet donc l’analyse de mélanges complexes. Cette technique a également l’avantage de tolérer certains sels, tampons ou détergents.100,116,118,142–144

37

5.1.3. Identification des protéines et traitements informatiques

Les données expérimentales issues de l’analyse des peptides par SM sont comparées aux données obtenues in silico à l’aide d’outils bio-informatiques. La première étape consiste à comparer les différentes données générées par SM avec celles présentes dans les différentes bases informatiques de données protéiques (par exemple, NCBI, US National Center for Biotechnology Information, ou Swiss-Prot, Swiss Institute of Bioinformatics, European Bioinformatics Institute,...).131,142,110,145 Les recherches dans ces bases de données se font par l’intermédiaire de quelques algorithmes commerciaux ou libres d’accès sur internet comme SEQUEST développé par ThermoScientific (http://www.thermoscientific.com), MASCOT développé par Matrix Science (http://www.matrixscience.com), Protein Prospector (http://prospector.ucsf.edu/) ou encore des sites comme ExPASy (http://www.expasy.org). Ces différents algorithmes permettent d’identifier la ou les protéines, si celles-ci sont déjà référencées dans les bases de données. L’identification est basée sur un score qui dépend entre autre du nombre de peptides ou de fragments SM/SM qui sont attribuées à la protéine, ou du nombre d’entrées de la banque. La deuxième étape, consiste à annoter les protéines identifiées, en d’autres termes à déterminer leur fonction. Pour cela, les séquences protéiques obtenues lors de l’identification des protéines vont être comparées aux séquences répertoriées appartenant à des protéines dont les fonctions sont connues par alignement de séquence BLAST (The Basic Local Alignment Search Tool).146 Cette recherche se fait par l’intermédiaire de programmes disponibles en ligne sur NCBI (http://blast.ncbi.nlm.nih.gov/Blast.cgi), UniProt (http://www.uniprot.org/blast/) ou FASTA (http://www.ebi.ac.uk/Tools/sss/fasta/). Les différents alignements de séquence ainsi réalisés permettent l’annotation des protéines étudiées par homologie de séquence notée en pourcentage, même si celles-ci proviennent de différentes espèces. Plus le pourcentage est élevé, plus l’annotation de la protéine est fiable.

Au niveau des applications de la protéomique, on peut citer par exemple la recherche de biomarqueurs protéiques pour le développement de test clinique dans le domaine médical. L’objectif est de trouver la ou les protéines associées à une pathologie ou à une réaction toxique sans avoir au départ connaissance de ces biomarqueurs. La recherche de ces biomarqueurs peut se faire en comparant deux échantillons issus par exemple d’une cellule saine par rapport à une cellule malade. L’analyse en SM des peptides issus de ces deux échantillons permet par différence d’identifier les biomarqueurs protéiques. Cependant, à ce jour, les méthodes de SM ne peuvent analyser individuellement que 2 000 peptides à la fois alors qu’on estime entre 10 000 et 35 000, le nombre de protéines dans une cellule humaine. Un protéome constitué de 10 000 protéines peut générer après digestion environ 350 000 peptides. Par conséquent, les

38

peptides doivent être séparés avant l’analyse en SM. Cependant, pour de nombreux protéomes, le nombre de peptides surpasse la capacité résolutive des techniques séparatives courantes.147

Mais le frein majeur à ce type d’approche réside principalement au niveau de la gamme très importante d’expression des protéines (dynamic range of protein expression) qui conduit à une absence de détection des protéines les moins abondantes, masquées par la présence des protéines les plus abondantes. Les protéines présentent une gamme de concentration très étendue pouvant aller d’un facteur 105 dans une bactérie à 107-108 dans une cellule humaine et pouvant atteindre 1012 dans le plasma humain.148 Pour bien se fixer les idées, dans un échantillons de plasma humain, les 10 protéines les plus abondantes représentent 90% des protéines totales dont l’albumine qui a elle seule représente plus de 50% des protéines. 22 protéines représentent 99% des protéines totales et les biomarqueurs recherchés sont en général dans le 1% restant (Figure 16).149 Or, la couverture de la gamme dynamique d’expression protéique par la spectrométrie de masse est limitée à 1012-107, on prend donc rapidement conscience du défi scientifique que constituent la recherche et l’identification de ces marqueurs protéiques.

Figure 16. Gamme dynamique et pourcentage des protéines présentes dans le plasma

39

La protéomique doit donc faire face à une complexité des extraits protéiques pour laquelle la résolution quantitative ainsi que l’identification de toutes les protéines présentes ne sont pas réalisables et elle peut donc conduire à une absence d'information si une protéine recherchée est en très faible abondance.