• Aucun résultat trouvé

Mise en évidence de régions fonctionnelles au sein de la protéine Nbs1 par une analyse de

Chapitre 2 : Prédictions de sites fonctionnels par conservation différentielle

2.2. Mise en évidence de régions fonctionnelles par analyse de conservation : la protéine Nbs1

2.2.2. Mise en évidence de régions fonctionnelles au sein de la protéine Nbs1 par une analyse de

En examinant plus précisément l’alignement des 25 séquences homologues de la protéine Nbs1, j’ai étudié si une analyse de la conservation des résidus pouvait permettre d’expliquer le rôle fonctionnel du tandem BRCT mis en évidence par Vincent Meyer.

Figure 28. Alignement multiple des séquences des domaines BRCT de la protéine Nbs1. Deux sous-familles de séquences

sont représentées par un rectangle rouge (séquences proches de la protéine humaine Nbs1), et un rectangle vert (séquences proches de la protéine de levure Xrs2, homologues de Nbs1 chez S. cerevisiae). Sur la ligne du bas sont représentées les structures secondaires (hélices en rouge, brins en vert) d’après les structures connues des tandems de domaines BRCT (1kzy, 2ado, 1l0b). Les triangles figurent les résidus en contact avec une sérine phosphorylée dans les structures connues (triangles rouges lorsque les contacts impliquent la chaîne latérale, triangles blancs lorsque les contacts se font par le squelette). Figure extraite de (Becker et al., 2006).

Différentes études ont montré que les tandems BRCT sont généralement impliqués dans la liaison des résidus phospho-sérines in vitro (Manke et al., 2003; Yu et al., 2003). Au niveau de la séquence, cette capacité à lier des phospho-sérines se caractérise par une signature spécifique, à savoir un motif [S/T-G] dans la première boucle du premier domaine BRCT, ainsi qu’un second motif [S/T-x-K] dans la seconde hélice du même domaine BRCT (Glover et al., 2004) (position des triangles rouges Figure 28). Concernant le premier motif, la glycine n’a probablement qu’un rôle mineur, car certains tandems de domaines BRCT ont la capacité de lier une phospho-sérine malgré la présence d’un autre résidu à cette position, comme c’est le cas du tandem BRCT de la protéine 53Bp1.

En analysant l'alignement de séquences (Figure 28), nous retrouvons un motif [S-C/F] dans la boucle β1/α1 ainsi que le motif [S/T-x-K] dans l'hélice α2 du premier domaine BRCT, strictement conservés, de l’homme à Y. lipolytica, ce qui suggère que ces protéines ont la capacité de lier des phospho-sérines. Pour des organismes plus distants, de K. yarrowii à S. paradoxus (Figure 28, Figure 29), certaines de ces positions, en particulier les positions pour lesquelles le contact avec la sérine phosphorylée se fait par la chaîne latérale (représentées par des triangles rouges sur la Figure 28) sont très conservées. Cependant, ces protéines ne respectent pas les motifs caractéristiques d’un site de liaison aux sérines phosphorylées. En particulier, pour la protéine Xrs2, homologue lointain de Nbs1 chez S. cerevisiae, le motif de la boucle β1/α1 est remplacé par un motif [P-P], celui de l'hélice α2 par un motif [S-x-R]. Cependant, certains indices laissent penser que le tandem BRCT de la protéine Xrs2 pourrait quand même lier des sérines phosphorylées. Premièrement, le domaine BRCT de la ligase III, capable de lier des sérines phosphorylées in vitro, contient une proline au lieu d’une sérine dans la boucle β1/α1 (Yu et al., 2003) comme c’est le cas pour Xrs2. Deuxièmement, une arginine au lieu d’une lysine est retrouvée dans le motif de l’hélice α2 chez la ligase IV, capable elle aussi de lier des sérines phosphorylées in vitro (Yu et al., 2003).

En analysant ainsi de façon manuelle l’alignement de séquences de protéines homologues à Nbs1, il apparaît que certains sites essentiels à la reconnaissance des sérines phosphorylées par le tandem BRCT, subissent certaines modifications dans leur composition, tout en gardant leurs fonctions. Ces sites correspondent à des positions conservées au sein de sous- familles de protéines, mais dont la nature des résidus varie entre ces mêmes sous-familles.

gi|49092096|A.nid ulans gi|27764306|P.ans erina gi|28921267|N.cras sa gi|46135723|G.zeae gi|50551973|Y.lipo lytica gi|54640867|D.pse udoobscura gi|23093793|D.melanogaster gi|57470768|D.rerio gi|37783603|X.laev is gi|12056576|G.gallus gi|9651648|R.norv egicus gi|26327733|M.mu sculus gi|57107833|C.familiaris gi|61821577|B.taurus gi|55630956|P.trog lodytes gi|55724995|P.pyg maeus pdb gi|30350868|K.yarrowii gi|45191003|E.gos sypii gi|50308093|K.lact is gi|50284923|C.glab rata gi|465488|S.cerevisiae S.paradoxus S.mikatae S.bayanus 0.1

Figure 29. Arbre phylogénétique de la protéine Nbs1. Deux familles de séquences peuvent être identifiées. En vert, les

séquences proches de la protéine de levure Xrs2 (S. cerevisiae), en rouge les séquences proches de la protéine humaine Nbs1. L’arbre phylogénétique a été construit avec le programme Clustalw (Thompson et al., 1994).

2.2.3. Mise en évidence de régions fonctionnelles au sein de la protéine Nbs1 par une analyse de conservation automatique : la méthode rate4site

Dans la section précédente, nous avons vu qu’en recoupant les informations issues des alignements de séquences, de la phylogénie des séquences, ainsi que de certaines données bibliographiques, il était possible de détecter des régions fonctionnelles importantes au sein de la protéine Nbs1. Cependant, une analyse manuelle telle qu’elle a été réalisée ne peut évidemment pas être envisagée à très grande échelle.

Certaines méthodes développées récemment, ont pour objectif de prédire ce type de région fonctionnelle de façon automatique (Landgraf et al., 2001; Lichtarge et al., 1996; Pupko et al., 2002). Parmi ces approches figure le programme rate4site (Mayrose et al., 2004; Pupko et al., 2002), dont l’originalité consiste à intégrer l’histoire évolutive des séquences afin d’en inférer

les taux d’évolution par site. Pour cela, rate4site estime le taux d’évolution des positions d’un alignement multiple de séquences en considérant la topologie et la longueur des branches de l’arbre phylogénétique associé à ces séquences. Si on considère un alignement de séquences et deux arbres phylogénétiques possibles (Figure 30), la prise en compte de l’arbre phylogénétique des séquences peut se révéler être d’un intérêt majeur. Dans l’exemple de la

Figure 30, la différence entre les arbres phylogénétiques 1 et 2 correspond à la longueur des

branches associées aux deux dernières séquences. Sachant que la probabilité qu’une mutation survienne est plus forte sur des branches longues, le site analysé (pointé par une flèche) est donc plus conservé dans le scénario évolutif du second arbre que dans celui du premier.

Figure 30. Influence de la phylogénie des séquences dans le calcul du score de conservation par le programme rate4site

(Mayrose et al., 2004; Pupko et al., 2002).

Comme nous l’avons illustré au travers de l’exemple de la protéine Nbs1, la prise en compte de l’histoire évolutive est essentielle, car elle permet la mise en évidence de sites fonctionnels apparemment variables si l’on considère l’alignement de séquence global, mais conservés si l’on analyse plus précisément les sous-familles de protéines représentées au sein de cet alignement de séquences. C’est pourquoi, j’ai souhaité tester la capacité du programme rate4site, à détecter ces régions fonctionnelles dans cette protéine, en particulier le site de liaison aux peptides phosphorylés mis en évidence par une analyse manuelle des séquences.

Après avoir calculé un score de conservation basé sur les taux d’évolution du programme rate4site pour chacune des positions de la protéine Nbs1, j’ai projeté ces scores de conservation à la surface d’un fragment de cette protéine, comprenant le tandem BRCT ainsi que le domaine FHA modélisé par E. becker (Becker et al., 2006)(Figure 31).

2

1

A B

Figure 31. Modèle d’assemblage du complexe FHA – tandem BRCT de la protéine Nbs1. (A) Représentation en rubans du

complexe. Les peptides phosphorylés, caractérisés dans les structures connues de domaines FHA et de tandems BRCT avec leur ligand, sont représentés sous forme de sphère (une phospho-sérine est reconnue par le premier domaine BRCT, et une phospho-thréonine est reconnue par le domaine FHA). (B) Conservation à la surface du complexe FHA – tandem BRCT. Les taux d’évolution ont été calculés par site avec le programme rate4site (Mayrose et al., 2004; Pupko et al., 2002), et projetés sur la surface de la protéine. La couleur de chaque résidu va du blanc au rouge pour les positions des moins conservées aux plus conservées. Figure extraite de (Becker et al., 2006).

Nous pouvons constater de façon intéressante que les sites de liaison aux peptides phosphorylés apparaissent soumis à une pression évolutive très forte (peptides pThr et pSer représentés en sphères en contact de la surface rouge dans la Figure 31). Malgré les variations importantes en termes de motif de reconnaissance, le programme rate4site a réussi à détecter cette région comme fonctionnellement importante grâce à la prise en compte de l’arbre phylogénétique des séquences. En analysant par le programme rate4site le premier domaine FHA de la protéine Nbs1, il apparaît également que le motif de liaison aux thréonines phosphorylés caractéristique des domaines FHA est également très conservé (Figure 31-B). De façon assez surprenante, l’analyse de la structure du modèle d’assemblage entre le domaine FHA et le tandem de domaines BRCT, révèle la présence d’une région très conservée chevauchant le domaine FHA et le premier domaine BRCT (Figure 31-B). Cette région particulièrement étendue, pourrait correspondre à un site de liaison spécifique à la protéine Nbs1, car certains des résidus impliqués dans cette zone ne sont par ailleurs pas particulièrement bien conservés dans d’autres sous-familles de domaines FHA (Figure 32-B).

A B

Figure 32. Conservation des domaines FHA. (A) Conservation du domaine FHA associé à un tandem BRCT. L’alignement de

séquence contient 25 séquences homologues à la protéine humaine Nbs1. (B) Conservation des domaines FHA d’après l’alignement de séquences des domaines FHA proposé par la banque de domaines Pfam (Bateman et al., 2002). Les analyses de conservation ont été réalisées par le programme rate4site (Mayrose et al., 2004; Pupko et al., 2002). La zone entourée par des pointillés comprend certains résidus conservés spécifiquement dans la famille de séquences homologues à la protéine Nbs1. Nous observons que le site de liaison aux thréonines phosphorylées caractéristique des domaines FHA, figuré par une flèche, est conservé dans les 2 cas.