• Aucun résultat trouvé

CHAPITRE 2 : LE PROGRAMME STATPEAKS

2.7 Les différentes statistiques calculées

Statpeaks calcule différentes statistiques afin de comparer les spectres d’un ensemble de peptides avec un autre ensemble (par ex. : peptides trypsiques versus peptides du CMH-I). Il fournit aussi des statistiques pour comprendre l’influence de chacun des acides aminés sur la fragmentation des peptides.

2.7.1 La complétude et l’ incomplétude de la fragmentation

On définit ici le concept de complétude et son opposé : l’incomplétude. On dit qu’un spectre est complet pour indiquer qu’aucune information additionnelle n’est utile à son

interprétation. Par exemple, si pour un peptide de n résidus le spectre expérimental contient tous les fragments yk avec k ∈ [1, n − 1] alors il s’agit d’un spectre complet. S’il manque un clivage, le spectre à un incomplétude égale à n−11 . Pour un peptide de n résidus, l’incomplétude I est définie par la formule suivante :

I= ∑ n−1 k=1min(e(yk), e(bk)) n− 1 (2.15) où e(yk) =      0 si ykexiste 1 sinon (2.16) et e(bk) =      0 si bkexiste 1 sinon (2.17)

On formule donc la complétude C par C = 1 − I.

2.7.1.1 Les rapports de chacun des types de fragments

Par rapport au nombre total de pics StatPeaks calcule pour chacun des types de fragments leur proportion par rapport au nombre total de pics. Il indique également le nombre de pics non assignés, c’est-à-dire les pics pour lesquels il ne fournit pas d’expli- cations sur leur origine.

Par rapport à la longueur du peptide Statpeaks détermine le rapport du nombre d’ions de chaque type par la longueur du peptide moins 1. Pour un type de fragment x, fx est désigné pour représenter ce rapport. Pour les ions de type a, b, c, x, y et z,

44 une valeur de 100% signifie que tous les ions du type donné sont observés. N(x) est le nombre de pics correspond à l’ion de type x. Pour un peptide de n résidus, ce nombre est au maximum égal à n − 1. fx se calcule par la formule suivante :

fx= 100 ∗

N(x)

n− 1 (2.18)

Pour un échantillon de m peptides et pour un type d’ions x, StatPeaks calcule la moyenne du ¯fxsuivant la formule :

¯fx= ∑ m 1 fx

m (2.19)

Le nombre de fragments internes pour un peptide de n résidus est compris entre 0 et ∑nk=2(n − k). Ce nombre peut donc excéder la valeur n − 1. Par conséquent, on peut donc obtenir une valeur supérieure à 100% pour ce type de fragments. L’intervalle de confiance est calculé par la technique du bootstrap.

2.7.1.2 Le profil de fragmentation

Le profil de fragmentation renseigne sur l’intensité relative de chacun des ions frag- ments d’un type particulier. Pour un échantillon de m peptides d’exactement n résidus, Statpeaks calcule pour i ∈ [1; n − 1], les intensités moyennes ¯Ii(x) des fragments de type

x(x ∈ {a, b, c, d, w, x, y, z}). Pour chaque ¯Ii(x), un intervalle de confiance est calculé par la technique du bootstrap.

2.7.2 L’influence des résidus adjacents au site de clivage

Statpeaks calcule l’effet que chaque acide aminé a sur le site de clivage et l’ion associé lorsqu’il est adjacent à celui-ci, du côté C-terminal ou N-terminal. Pour calculer la fréquence de clivage ΦT(a) pour chaque acide aminé a, au site correspondant au

terminus T ∈ {N,C}, il compte le nombre de fois qu’un ion est observé correspondant au clivage pour cet acide aminé OT(a), et divise par le nombre d’occurrences du résidu dans

l’ensemble des séquences O(a). La technique du bootstrap est utilisée pour déterminer l’intervalle de confiance.

ΦT(a) = ∑ OT

(a)

∑ O(a) (2.20)

2.7.2.1 L’influence des résidus non-adjacents au site de clivage

Statpeaks permet d’évaluer l’influence des résidus non-adjacents au site de clivage sur la production des fragments. Il calcule le nombre de fois que chaque acide aminé a est présent à l’intérieur des fragments identifiés à l’exception de la position adjacente au site de clivage et divise par le nombre de fois que l’acide aminé est présent à l’intérieur de tous les fragments possibles. L’intervalle de confiance est déterminé par la technique du bootstrap.

2.7.2.2 Le N-biais par acide aminé

Statpeaks calcule l’effet de chacun des acides aminés sur la directionnalité de la fragmentation. Pour ce faire, on utilise la méthode utilisée par Tabb et al. [77]. Pour chacun des résidus dans le peptide, le programme cherche dans le spectre les pics des ions produits par la fragmentation à chacun des côtés C-terminal et N-terminal. Pour calculer le N-biais (N ), le programme soustrait l’intensité du pic C-terminal au pic N-terminal pour un type d’ion donné (ex. : b ou y), et divise par la somme des deux intensités. Par exemple, pour calculer le N-biaisN (Pro)bde l’acide aminé Pro pour les

46

N (Pro)b=

Ib(i) − Ib(i + 1)

Ib(i) + Ib(i + 1) (2.21) où Ib(i) est l’intensité de l’ion b produit par le clivage au côté N-terminal de l’acide

aminé Pro, et Ib(i + 1) est l’intensité de l’ion b produit par le clivage au côté C-terminal. Si le pic pour l’ion b produit du côté C-terminal (N-terminal) n’est pas trouvé, le N- biais est égal à 1 (-1). On calcule ensuite la moyenne sur l’ensemble des spectres et on applique la méthode du bootstrap pour déterminer l’intervalle de confiance.

2.7.3 La carte de fragmentation par paires

Statpeaks calcule la fréquence de clivage entre les résidus des 400 couples d’acides aminés possibles ainsi que leur abondance (autrement dit, l’intensité moyenne des ions fragments résultants). Les résultats sont représentés sous forme de matrice. Les lignes représentent les résidus en position N-terminal du site du clivage alors que les colonnes représentent les résidus en position C-terminal. Comme montré sur la figure 2.1, chaque case de la matrice est remplie proportionnellement au nombre d’occurrences du couple de résidus correspondant dans l’ensemble des données. Lorsqu’il y a au moins 10 oc- currences, la case est pleine. S’il y en a 5, la case est à moitié pleine. Ceci permet de représenter la confiance que l’on a dans chacune des valeurs de la matrice.

Documents relatifs