• Aucun résultat trouvé

Application 1 : Modélisation structurale du complexe entre les domaines CS et ATPase de

Chapitre 4 : Prédiction des assemblages macromoléculaires

4.6. Applications de la méthode SCOTCH à des complexes étudiés au sein de l’équipe

4.6.1. Application 1 : Modélisation structurale du complexe entre les domaines CS et ATPase de

Les protéines chaperons telles que la protéine Hsp90, sont impliquées dans un grand nombre de voies de signalisation et constituent un des centres d’intérêt de notre équipe. Certaines protéines, décrites sous le terme de co-chaperons, participent à la régulation et à la spécificité de reconnaissance de la protéine Hsp90. Parmi ces protéines, SGT1 apparaît comme un acteur essentiel de certaines voies de signalisation telles que les voies d’ubiquitination dans la levure, de formation du kinétochore chez l’homme et la levure ou encore des voies de résistance aux agents pathogènes chez les plantes. En 2003, Takahashi et collaborateurs ont montré que la protéine SGT1 interagissait physiquement avec la protéine Hsp90 chez A. thaliana, et que deux domaines étaient impliquées dans cette interaction : le domaine central CS de SGT1 et le domaine ATPase de Hsp90 (Takahashi et al., 2003) (Figure 65).

Figure 65. Interaction entre la protéine chaperon Hsp90 et son co-chaperon SGT1. Les domaines CS de SGT1 et ATPase de

Les auteurs de cette étude ont alors initié une collaboration avec certains membres de notre équipe, afin de déterminer la structure du complexe impliquant ces deux domaines protéiques. Béatrice Amigues, au cours de son travail de thèse, a caractérisé expérimentalement la structure du complexe entre ces deux domaines, par des techniques de résonance magnétique nucléaire (RMN), et a identifié ainsi de façon précise le site d’interaction impliquant ces deux domaines protéiques (Boter et al., 2007). Cependant, l’orientation relative des partenaires et les contacts exacts entre acides aminés de l’interface n’étaient pas connus. À partir de ces données expérimentales, j’ai donc utilisé l’outil de docking dédié HADDOCK, décrit dans la section 1.5.3, pour construire des modèles du complexe.

Le complexe impliquant les domaines ATPase de Hsp90 et CS de SGT1 apparaît comme un modèle d’étude intéressant pour tester les capacités prédictives de l’approche SCOTCH. En effet, ces domaines protéiques sont conservés chez tous les eucaryotes, de la levure à l’homme (Lee et al., 2004), ce qui rend accessible son étude par des techniques évolutives. De plus, les données structurales et biochimiques obtenues par Béatrice Amigues permettent de modéliser la structure du complexe, et ainsi de valider ou réfuter les prédictions obtenues avec la méthode SCOTCH. D’un point de vue méthodologique, le cas Hsp90/SGT1 est intéressant car il fait intervenir deux protéines avec des caractéristiques évolutives très différentes. La séquence de Hsp90 est beaucoup plus conservée (70 % d’identité entre l’homme et S. cerevisiae) que celle du domaine CS de SGT1 (33 % d’identité entre homme et S. cerevisiae)

Détermination de la structure du complexe par l’intégration de données RMN dans le

logiciel de docking HADDOCK. La structure à haute résolution du complexe entre les

domaines CS de SGT1 et ATPase de Hsp90 n’est pas encore connue. On dispose seulement, pour valider les prédictions de la méthode SCOTCH, d’un ensemble de contraintes expérimentales obtenues par Béatrice Amigues par des analyses RMN couplées à des expériences de mutagénèse ciblées. Une première étape de la validation a donc consisté à générer l’ensemble des structures de complexes compatibles avec ces contraintes expérimentales. Par des techniques de RMN, Béatrice Amigues a au cours de sa thèse, identifié différents résidus impliqués dans l’interaction entre les domaines CS de SGT1 et

ATPase de Hsp90. Pour cela j’ai utilisé le programme dédié à ce type de problématique, nommé HADDOCK (Dominguez et al., 2003). J’ai introduit les données RMN et de mutagénèse sous forme de contraintes ambigües, afin de produire des modèles d’assemblages compatibles avec ces données. Pour cela, j’ai définit deux classes de résidus : les résidus actifs affectés par la présence du partenaire protéique en RMN, et les résidus passifs, voisins de ces résidus au niveau structural, et accessibles au solvant (voir section 7.2.3). Ces résidus sont présentés pour chacun des deux domaines à la Figure 66.

A B

Figure 66. Définition des résidus actifs et passifs pour le docking moléculaire sous HADDOCK pour le domaine CS (A) et pour

le domaine ATPase de Hsp90 (B). Les résidus actifs sont représentés en rouge, les résidus passifs en vert, et les résidus peu accessibles au solvant en jaune.

Après la première phase de docking rigide, 1000 modèles on été générés, puis classés suivant leur énergie d'interaction. Les 200 meilleurs modèles sont ensuite soumis à la seconde phase de recuit simulé semi-flexible, puis à la troisième phase de raffinement en solvant explicite. À l'issue de ces différentes étapes, les 200 meilleures structures ont été classées en sous ensembles à partir d'un critère de RMSD calculé par paires de complexes, au niveau des interfaces (le seuil de classification étant de 3Å).

En analysant les structures obtenues à l’issue de cette procédure, nous avons constaté que ces différents modèles se regroupaient en deux principaux clusters structuraux (Figure 67). Pour

chacun des deux clusters, le modèle de plus basse énergie a été retenu comme représentatif du cluster (Figure 68).

Figure 67. Energies d'interaction inter-moléculaires des modèles en fonction de leur RMSD par rapport au modèle de plus

basse énergie. Les carrés correspondent aux modèles, et les cercles aux moyennes des deux principaux clusters avec leur écart type.

A B

Figure 68. Modèles d'assemblages des domaines CS (en rouge) et du domaine ATPase de Hsp90 (en bleu). (A) modèle de

plus basse énergie du cluster 1. (B) modèle de plus basse énergie du cluster 2. Ces modèles d’assemblages correpondent aux deux modes d’assemblage possibles identifiés par le programme HADDOCK (Dominguez et al., 2003).

Les contraintes expérimentales obtenues par la RMN et les premières données de mutagénèse ne permettent donc pas de discriminer entre deux modes d’assemblage très différents. Ce cas de figure particulier est probablement dû à une symétrie dans la répartition

impliquée dans l’interaction. Pour lever l’ambiguïté entre ces deux orientations, de nouvelles mutations ont été proposées à nos collaborateurs expérimentalistes. L’objectif de ces nouveaux mutants n’était plus d’abroger l’interaction entre SGT1 et Hsp90 mais de restaurer l’interaction perdue par un premier mutant. De tels mutants sont appelés compensatoires et impliquent généralement des acides aminés chargés dont on inverse la charge. Une paire de mutations sur les résidus E223 de SGT1 et K88 de Hsp90 permet d’observer ce phénomène de compensation et constitue donc une indication précise d’une interaction entre ces deux résidus (Figure 69). Cette interaction n’est possible que dans le cas du cluster 1, et indique que le modèle représentatif de ce cluster correspond à la structure la plus proche de la structure native.

Figure 69. Expérience de GST-pulldown effectuée en liant soit le domaine CS de SGT1 sauvage (A. thaliana) soit un mutant

ponctuel de ce domaine (E223K) à une colonne de GSH-agarose grâce à une fusion avec la GST. Une forme sauvage de Hsp90 (HSP80 chez A. thaliana) ou une forme mutée sur la position K88E est plus ou moins retenue en fonction de l’affinité entre les protéines. Dans ce cas, le mutant Hsp90-K88E restaure l’interaction avec GST-CS-E223K et correspond donc à une mutation compensatoire.

Comparaison avec les modèles d’assemblage les plus probables sélectionnés par

l’approche SCOTCH. Par une recherche de séquences protéiques homologues aux domaines

CS et ATPase de Hsp90 dans les bases de données de séquences protéiques, j’ai identifié 41 espèces présentant des orthologues potentiels de ces protéines. J’ai ensuite aligné ces séquences en vue d’une analyse par la méthode SCOTCH (voir section 7.2.3).

La méthode SCOTCH optimisée par RPScore a ensuite été appliquée afin de prédire l’orientation entre les domaines CS de SGT1 et ATPase de Hsp90. Pour cela, 10000 orientations ont été générées par le programme FTDock, puis les 20 meilleurs modèles ont été retenus sur la base de leur score évolutif.

Parmi les solutions retenues par l’approche SCOTCH, le modèle n°12 est située à 3.9 Å de la solution correspondante au cluster 1 du programme HADDOCK (Figure 70). Aucune solution proposée par SCOTCH ne s’apparente au mode d’assemblage sélectionné dans le cluster 2. Ainsi, les prédictions obtenues avec la méthode SCOTCH apparaissent en très bon accord avec les données expérimentales dont on dispose à l’heure actuelle. De plus, l’obtention d’un mutant compensatoire est extrêmement intéressante d’un point de vue physiologique pour comprendre le rôle de l’interaction spécifique entre SGT1 et Hsp90. Dans le cas de ce complexe, je n’ai malheureusement pas eu le temps d’explorer si la structure sélectionnée à basse résolution donnait lieu à un funnel énergétique quand on la perturbait de quelques angströms (voir section 4.5). C’est une des étapes très intéressantes de ce projet qu’il reste à effectuer.

Figure 70. Modèle d'assemblages des domaines CS (A) et du domaine ATPase de Hsp90 prédit par la méthode SCOTCH

optimisée par RPScore (Moont et al., 1999). 10000 modèles d’assemblages ont été produits par le programme FTDock (Gabb et al., 1997), puis les 20 meilleures solutions ont été retenues. Le modèle présenté a été classé en 12ème position par l’approche SCOTCH optimisée par RPScore. Le domaine CS est représenté en rouge, le domaine ATPase est représenté en bleu.