• Aucun résultat trouvé

3.4. Application de l’utilisation de l’outil « Scout-SRM » à la cinétique et l’analyse

3.4.4. Etablissement de la liste de protéines cibles

Puisque le génome de Dickyea dadantii 3937 est entièrement séquencé, une liste de protéines a été établie grâce à la comparaison entre les spectres MS/MS générés dans une analyse de type DDA Top 10, et des spectres théoriques issus de la digestion et de la fragmentation in silico de la base de données UniprotKB, http://www.uniprot.org/.

Dans un objectif de rapidité, cette analyse a été menée uniquement sur deux conditions extrêmes afin de déterminer une liste de protéines très différenciantes. L’échantillon 0H est donc analysé, ainsi que l’échantillon 48H qui est le plus concentré des 3 points de la cinétique d’infection. Afin de palier au mieux le sous-échantillonnage dû aux analyses DDA, chaque échantillon a été préparé en triplicat, chacun eux-mêmes analysés 2 fois.

A partir de la liste de protéines identifiées selon la méthode décrite en 3.4.2, une liste plus restreinte de protéines d’intérêt a été établie. Les différentes étapes de sélection des protéines, ainsi que les résultats sont résumés sur la Figure 39.

Figure 39 : Résultats d'identification de protéines après analyse DDA, et sélection des protéines d'intérêt

Les listes de peptides et protéines, issues de l’identification des spectres MS/MS des échantillons 0H et 48H, sont compilées et intégrées dans le logiciel Skyline 3.0 ® afin de retraiter les résultats. Cette analyse a permis l’identification de 3533 peptides rapporteurs de 666 protéines. L’identification étant faite sur une base de données non revue, les informations redondantes sont nombreuses, notamment au niveau des protéines homologues. Ainsi, une première étape de tri a consisté en la suppression des informations redondantes au niveau peptidique. Ensuite, seules les protéines identifiées avec au moins deux peptides ont été conservées pour la liste finale. Suite à cela, 473 protéines identifiées

moyenne, la librairie contient 5 peptides par protéines, avec au minimum 2 peptides par protéines et un maximum de 27 peptides.

Afin d’obtenir une première visualisation de la variation de l’expression du protéome de Dickeya dadantii, une seconde étape a consisté en la quantification différentielle sans marquage, de ces 473 protéines. Celles-ci sont représentées par un nombre variable de peptides, or il est important de synthétiser les informations de tous les peptides identifiés pour permettre une conclusion au niveau de la protéine. De plus, il est difficile de contrôler toutes les variabilités qui peuvent survenir sur l’intensité du signal d’un peptide, par exemple les interférences, la capacité d’ionisation, une mauvaise intégration de l’aire du peptide, l’effet matrice, la quantité de matériel injecté. Le code MSStats utilisé à travers Skyline 3.0 ®, applique un modèle permettant de caractériser ces sources de variations en analysant l’ensemble des données conjointement pour toutes les conditions disponibles. L’intensité observée pour tous les peptides dans chacune des conditions va subir une normalisation par la totalité des signaux observés dans la même condition pour le même réplicat. Les intensités de pics MS1 qui varient pour un même peptide entre les réplicats vont avoir un poids moins important dans la conclusion au niveau de la quantification de la protéine. Au final, MSStat suit une procédure standard de tests statistiques en calculant le ratio de la différence estimée sur l’erreur standard pour chaque protéine, en comparant le test statistique à la distribution de Student (avec comme hypothèse nulle que la différence de la moyenne de l’abondance de la protéine entre deux conditions est nulle) avec un degré de liberté approprié pour obtenir une p.value, et en ajustant la p.value comme il est nécessaire pour des comparaisons multiples selon la méthode de Benjamini et Hochberg 166.

Cette méthode nous a permis de réaliser l’analyse de l’expression de 473 protéines de

Dickeya dadantii entre une culture réalisée en milieu liquide et une culture après 48H de

Figure 40 : Quantification différentielle de 473 protéines de Dickeya dadantii identifiées dans une analyse non ciblée, entre une culture en milieu liquide et une culture exposée 48H sur endives

La Figure 40, représente les protéines différentiellement exprimées entre une culture en milieu riche de Dickeya dadantii et une culture de 48H sur des feuilles d’endives. La ligne horizontale (en bleu, à – log10 p-value = 1,3), sépare les résultats significatifs, c’est-à-dire de p-value ajustée inférieure ou égale à 0,05, des résultats non significatifs. Sur les 473 protéines quantifiées, 142 apparaissent comme différentiellement exprimées de manière significative (p-value ajustée ≤ 0,05 et 1 ≤ log2 FC ≤ -1). Parmi celles-ci, 84 protéines sont sous-exprimées (p-value ajustée ≤ 0,05 et log2 FC ≤ -1) et 58 sont sur-exprimées (p-value ajustée ≤ 0,05 et 1 ≤ log2 FC).

Cette méthode de quantification différentielle faiblement robuste, a tout de même permis d’observer une vue d’ensemble de la régulation de l’expression des protéines de Dickeya

dadantii lors de la mise en place de sa virulence, ainsi que d’effectuer un premier tri des

protéines à quantifier dans la méthode ciblée.

En parallèle, une liste de protéines codées par des gènes connus pour être impliqués dans la virulence de Dickeya dadantii a été établie par Jean-Marie Lacroix. Cette liste a été comparée à la liste d’identification obtenue par l’analyse protéomique globale (Tableau 10).

Tableau 10 : Liste de protéines codées par des gènes de virulence de Dickeya dadantii, et résultat de leur recherche dans la culture 0H et la culture 48H

Parmi cette liste, 5 protéines n’ont pas été détectées dans l’analyse non ciblée. Celles-ci ont alors été recherchées en SRM dans les échantillons 0H et 48H. La liste de peptides et de transitions a été établie comme décrit dans le Chapitre 2, par digestion et fragmentation in

silico des protéines via Skyline 3.0 ®. Seules les protéines codées par les gènes sodA et

opgH ont pu être détectées, par respectivement 4 et 2 peptides. Les 6 peptides détectés ont été ajoutés à la liste d’intérêt.

GENE N° ACCESSION PROTEINE VUE DANS ANALYSE

DDA RECHERCHE VUE APRES SRM

degP E0SBJ4 oui NA

degQ E0SHD8 oui NA

sodA E0SN84 non oui

fliT Q8RST2 non non

flhC E0SIM9 oui NA

flhD E0SIN0 non non

opgG Q9F496 oui NA

opgH Q9F495 non oui

rcsB E0SDZ3 oui NA

Nous avons ainsi établi une liste de 475 protéines d’intérêt, identifiées par 2173 peptides rapporteurs, avec une moyenne de 5 peptides par protéines.