• Aucun résultat trouvé

Partie II Développement de méthodes d’analyse

CHAPITRE 3 Recherche dans les banques de données

A. Optimisation fine des paramètres du moteur de recherche

En moyenne, quel que soit l’instrument du laboratoire utilisé, environ 75 % des spectres ne sont pas assignés après recherche dans les banques de données. Afin de réduire ce nombre, les paramètres de recherche du moteur Mascot ont été évalués en utilisant des données issues d’un gel 90 bandes injecté sur la trappe ionique AmaZon précédemment décrite dans la Partie II – chapitre 2. L’échantillon compte environ 2000 protéines et 10 000 peptides.

Le moteur de recherche Mascot, présenté de manière plus détaillée dans la Partie I – chapitre 2, se base sur l’utilisation de deux scores : le score de corrélation, qui évalue la qualité du spectre, et le score d’identité qui prend en compte l’espace de recherche généré pour l’identification de chaque peptide. Plusieurs paramètres, réglés par l’utilisateur, peuvent influencer le résultat final :

 la taille de la banque protéique ;

 la tolérance définie sur le précurseur et les fragments ;

 l’enzyme utilisée ;

 les modifications recherchées ;

 le nombre de coupures protéolytiques manquées.

A.1. Erreur sur la masse du précurseur

Dans un premier temps, l’erreur optimale à utiliser pour effectuer les recherches dans les banques de données a été évaluée. Il s’agit ici de réduire au maximum le nombre d’identifications possibles afin de limiter les faux positifs. Une recherche a été réalisée en tolérant une erreur sur la détermination du précurseur de ± 0,3 Da. La figure 68 présente, pour chaque spectre assigné, l’erreur sur le précurseur en fonction du score de corrélation attribué par Mascot. Les résultats montrent qu’il est possible de restreindre la tolérance sur la masse du précurseur à ± 0,2 Da.

Chapitre 3 : recherche dans les banques de données Partie II

99 ▐

Figure 68

Erreur sur la masse obtenue pour chaque spectre identifié sur la trappe ionique AmaZon en fonction du score de corrélation (erreur de ± 0,3 Da sur le parent)

Dans un deuxième temps, la fenêtre de recherche a été ouverte à 3 Da. La figure 69 montre l’erreur obtenue sur l’ensemble des peptides identifiés en fonction du score de corrélation. De manière surprenante, des massifs sont observés autour de 0,1 et 2 Da et non autour de - 1 et - 2 Da. Deux hypothèses peuvent expliquer cet état de fait :

 Des modifications post-traductionnelles non prises en compte affectent la masse des peptides, par exemple des amidations ou des déamidations.

Les massifs isotopiques sont mal interprétés et c’est l’isotope p+1 qui est pris en compte

comme masse du précurseur au lieu du pic mono-isotopique p.

Figure 69

Erreur sur la masse obtenue pour chaque spectre assigné sur la trappe ionique AmaZon en fonction du score de corrélation (erreur de ± 3 Da sur le parent)

Afin de valider l’une ou l’autre des hypothèses, la même expérience a été réalisée sur les mêmes données acquises sur un appareil haute résolution (Rs = 60 000) : le Q-TOF Maxis de Bruker Daltonics. Contrairement aux résultats précédents, un massif principal est observé, centré autour de 0 Da, et des identifications ponctuelles sont réalisées à ± 1, ± 2 et ± 3 Da (cf. figure 70). Cela montre que les modifications post-traductionnelles induisant ces différences sont des évènements rares par rapport à

-0,4 -0,3 -0,2 -0,1 0 0,1 0,2 0,3 0,4 0 50 100 150 200 Er re u r su r la m asse (Da) Score de corrélation -4 -3 -2 -1 0 1 2 3 4 0 50 100 150 200 Er reu r sur la m as se (Da ) Score de corrélation

Partie II Chapitre 3 : recherche dans les banques de données

▐ 100

l’ensemble des identifications, et donc que les massifs observés dans les résultats obtenus avec un instrument basse résolution sont dus à des erreurs d’attribution du pic mono-isotopique.

Figure 70

Erreur sur la masse obtenue pour chaque spectre assigné sur le Q-TOF Maxis en fonction du score de corrélation (erreur de ± 3 Da sur le parent)

Afin de pallier ce problème, nous avons mis en œuvre l’option « 2 13C », qui permet de tenir compte des erreurs d’attribution du pic mono-isotopique. Notons que l’option « multi-isotopes », présente dans le moteur de recherche Omssa, joue le même rôle. La figure 71 montre les massifs d’identifications obtenus à 0,1 et 2 Da avec une erreur de ± 0,2 Da. Ce paramètre permet d’identifier les ions dont le pic mono-isotopique est mal assigné tout en gardant une erreur sur la masse du précurseur réaliste.

Figure 71

Erreur sur la masse obtenue sur la trappe ionique AmaZon pour chaque spectre assigné en fonction du score de corrélation (erreur de ± 0,2 Da sur le parent et utilisation de l’option 2 13C)

-4 -3 -2 -1 0 1 2 3 4 0 50 100 150 Er re u r su r la m asse (Da) Score de corrélation -0,5 0 0,5 1 1,5 2 2,5 0 50 100 150 200 Er re u r su r la m asse (Da) Score de corrélation

Chapitre 3 : recherche dans les banques de données Partie II

101 ▐

A.2. Modifications post-traductionnelles

Afin de détecter la présence de modifications post-traductionnelles non attendues, le mode « Error

tolerant » a été utilisé225. Une première recherche est effectuée dans la banque de données suivant les paramètres indiqués par l’utilisateur. Lors de la deuxième recherche, les paramètres sont considérablement élargis pour tenter d’identifier les spectres non assignés :

 Des coupures semi-spécifiques sont autorisées

 Le nombre de coupures manquées est augmenté de 1

 La liste des modifications est testée en série

 150 types de substitutions de résidus d’acides aminés sont testés en série

Une seule déviation par peptide est autorisée. La figure 72 montre les résultats d’identification obtenus sur l’ensemble des 10 000 peptides. Comme attendu, la carbamidométhylation des cystéines et l’oxydation des méthionines font partie des modifications majeures. Par contre, il est intéressant d’observer une forte proportion de modifications propionamides et déamidations. Afin de vérifier qu’il ne s’agit pas d’un effet dû à la basse résolution de la trappe ionique AmaZon (Bruker Daltonics), la même recherche a été effectuée sur un échantillon semblable injecté sur un appareil haute résolution, le Q-TOF Maxis (Bruker Daltonics). La modification propionamide apparaît aussi sur un grand nombre de peptides, mais peu de déamidations sont observées.

Figure 72

Réparation des modifications identifiées sur chaque spectre pour des analyses réalisées sur un appareil basse résolution, la trappe ionique AmaZon (A), et un appareil haute résolution, le Q-TOF Maxis (B)

La modification propionamide est causée par le gel de polyacrylamide. En effet, la double liaison de l’acrylamide libre dans un gel peut réagir avec des groupements sulfhydryles (–SH) libres pour former un adduit de cystényl S-propionamide. Grâce à l’ajout de cette modification dans les paramètres de recherche, 5 % de peptides supplémentaires sont identifiés (non identifiés si la modification n’est pas implémentée) et la proportion de spectres non assignés est réduite de 4 %.

Partie II Chapitre 3 : recherche dans les banques de données

▐ 102

Finalement, les modifications oxydation, carbamidométhylation et propionamide seront conservées pour effectuer les recherches. L’ajout des modifications méthylation et acétylation N-ter pourrait éventuellement être envisagé mais la partie 1.4. montrera que cette option n’est pas judicieuse.

A.3. Étude de la spécificité de l’enzyme

La spécificité de l’enzyme a été étudiée de la même manière que précédemment, c’est-à-dire en utilisant l’option « Error tolerant ». La figure 73 présente le pourcentage de coupures manquées identifiées ainsi que le nombre de peptides semi-trypsiques. Les résultats montrent qu’un nombre de coupures manquées de 1 est largement suffisant. Par ailleurs, 4 % des spectres correspondent à des identifications de peptides semi-trypsiques. Malgré le gain en identifications, cette option n’a pas été choisie car elle augmente considérablement l’espace de recherche et donc le temps d’analyse ainsi que la monopolisation des ressources informatiques du laboratoire.

Figure 73

Spécificité de l'enzyme évaluée grâce à la recherche Mascot en mode "Error tolerant"

(A) Pourcentage de coupures manquées de l'enzyme observée. (B) Pourcentage de peptides semi-trypsiques identifiés.

Pour la suite, une coupure manquée sera autorisée et l’enzyme sera considérée comme spécifique.

A.4. Évaluation de l’impact des changements de paramètres

L’impact de divers changements des paramètres de recherche a été évalué sur le score « identité ». En effet, ce score est révélateur de la taille de l’espace de recherche et une augmentation importante de celui-ci va conduire à une augmentation de la probabilité d’identifier des faux positifs. Une première méthode a été établie avec sept modifications, deux carbones 13 et 0,2 Da d’erreur. Les paramètres ont été ensuite modifiés séquentiellement à partir de cette méthode. La figure 74 montre l’évolution du score d’identité moyen suivant les paramètres choisis. Le passage de la méthode 1 à la méthode 2 (tolérance sur le précurseur augmentée à 0,3 Da) n’a que peu d’influence. En revanche, le passage de la méthode 1 à la méthode 3 (trois modifications au lieu de sept) permet de diminuer de 10 points le score identité. Enfin, le passage à la méthode 4 (pas d’utilisation de l’option 13C) a une influence légère. Ainsi, il est possible de conclure que le nombre de modifications recherchées a un impact élevé sur le score d’identité. Par contre, l’erreur sur la masse du précurseur ou l’ajout de carbones 13 est moins

Chapitre 3 : recherche dans les banques de données Partie II

103 ▐

critique. Dans cette optique, les modifications précédemment suggérées comme les méthylations et acétylations ne seront pas utilisées pour les recherches.

Figure 74

Évaluation de la variation du score d'identité moyen suivant la méthode utilisée

Méthode 1 : 7 modifications, 2 13C et ± 0,2 Da d’erreur sur le précurseur Méthode 2 : 7 modifications, 2 13C et ± 0,3 Da d’erreur sur le précurseur Méthode 3 : 3 modifications, 2 13C et ± 0,2 Da d’erreur sur le précurseur Méthode 4 : 7 modifications, 0 13C et ± 0,2 Da d’erreur sur le précurseur