Perturbations locales des structures de complexes

Chapitre 4 : Prédiction des assemblages macromoléculaires

4.5. Obtention de modèles d’assemblages à haute résolution

4.5.2. Perturbations locales des structures de complexes

Pour effectuer la première étape, destinée à perturber la structure du complexe à analyser, SCOTCHer procède à des opérations de translations et de rotations de la structure, suivies d’une optimisation de la conformation des chaînes latérales au niveau de la région d’interaction. Ainsi, après avoir perturbé légèrement la structure du plus petit des deux partenaires par une opération de translation (suivant l’axe passant par le centre de gravité des deux molécules), une rotation aléatoire est appliquée à cette molécule. En ce qui concerne les opérations de rotation, j’ai opté pour une méthode mathématique plus efficace que la méthode d’Euler : la méthode des quaternions. Au lieu de tourner un objet à partir d’une série de rotations successives comme c’est le cas pour les angles d’Euler, les quaternions permettent de le tourner autour d'un axe arbitraire et d'un angle quelconque. Un premier intérêt de la méthode des quaternions est qu’elle permet d’obtenir des transformations beaucoup moins redondantes qu’en utilisant la méthode d’Euler (Kuffner, 2004) (Figure 57). Par ailleurs, il est possible de calculer très rapidement les transformations spatiales à effectuer sur les coordonnées d’une protéine pour la faire tourner comme une rotule autour de la surface de son partenaire (méthode d’interpolation appelée « slerp » pour « spherical linear interpolation » illustrée Figure 58).

Figure 57. Comparaison entre (A) un échantillonnage naïf des rotations par variation systématique des angles d’Euler (B)

échantillonnage des rotations obtenu par variation systématique des quaternions. Figure extraite de (Kuffner, 2004).

Parternaire A

Mouvements du Parternaire B

Figure 58. La méthode d’interpolation « slerp » appliquée aux quaternions permet de calculer très rapidement les

transformations à effectuer sur les coordonnées d’une protéine pour effectuer des rotations le long d’une trajectoire sur une sphère entre deux états symbolisés ici par les cubes vert et bleu (la position des protéines correspondantes est indiquée sur le schéma de droite).

À chaque pas de perturbation sur la structure d’un complexe, le programme SCOTCHer procède à une optimisation de la conformation des chaînes latérales par des techniques issues de la théorie des graphes. Pour cela, les contacts entre les chaines latérales de l’interface de la structure du complexe sont représentés sous la forme d’un graphe décrivant les interactions entre chaque résidu (Figure 59). Cette représentation permet de hiérarchiser la recherche combinatoire de la meilleure orientation des chaînes latérales ou rotamères2_et

conduit à un gain sensible dans la vitesse d’exploration conformationnelle.

2 _{Un rotamère est un élément d'un ensemble de conformères résultant d'une rotation restreinte autour d'une}

Figure 59. Représentation des contacts entre paires de résidus sous la forme d’un graphe. Figure extraite de (Canutescu et al.,

2003).

Pour l'optimisation des chaînes latérales à l'interface des partenaires en interaction, deux étapes sont nécessaires. La première consiste à rechercher les composantes connexes du graphe qui sont des ensembles maximaux tel qu'il existe un chemin entre deux sommets quelconque leur appartenant. L’identification de composantes connexes permet de réduire le coût algorithmique en subdivisant le graphe initial en sous graphes qui peuvent être optimisés indépendamment.

Figure 60. Représentation des contacts entre paires de résidus sous la forme d’un graphe. Les composantes connexes du

graphe sont entourées par des pointillés. Figure adaptée de (Canutescu et al., 2003).

Dans l’exemple exposé à la Figure 60, deux composantes connexes sont présentes. Lorsque le nombre de nœud d'un graphe connexe est important, comme c’est le cas dans l’exemple de la Figure 59 (11 nœuds), le temps de calcul nécessaire pour déterminer la combinaison optimale des rotamères devient trop lourd. Un nouvel algorithme, proposé dans la dernière version du programme SCWRL (Canutescu et al., 2003), a donc été implémenté lorsque le nombre de nœud est supérieur à 5. Il consiste à dissocier les graphes connexes en sous

graphes par la recherche des composantes biconnexes3_{. En corollaire, lorsque aucun cycle ne}

passe par une arête, celle-ci forme une composante biconnexe à elle seule). Les graphes biconnexes peuvent aussi bien être des cycles que des paires de résidus connectées par une arête. À titre d'exemple, le graphe de la Figure 61 peut être subdivisé en 5 composantes biconnexes : A (résidus V10, R15, Y21, et K17), B (résidus K17 et T30), C (résidus T30, Q25, M32, H29, et W11), D (résidus W11 et F35) et E (résidus W11 et D39).

Figure 61. Résolution d’un problème d’optimisation par la recherche des composantes biconnexes d’un graphe. L’énergie

minimum associée au graphe représenté à la Figure 59 est déterminée par l’identification successive de l’énergie minimum associée à chacune des composantes biconnexes du graphe. Chacune des composantes biconnexes sont résolues, comme indiqué dans la colonne de droite, puis agrégées pour ne former plus qu’une seule composante. Figure extraite de (Canutescu et al., 2003).

3 _{Une composante biconnexe est un ensemble maximal d'arêtes (non orientées) qui vérifient la propriété}

suivante : « Soient a et b deux arêtes distinctes, alors il existe un cycle simple (qui ne passe pas deux fois par le même sommet) qui passe par a et b ».

Les nœuds apparaissant dans plus d’une composante biconnexe sont appelés « points d’articulation4_{». L’élimination des points d’articulation va donc avoir pour effet la}

subdivision du graphe initial en sous graphes.Au niveau du graphe représenté à la Figure

59_{, les résidus K17, T30 et W11 sont des points d’articulation. Afin de trouver les}

composantes biconnexes d’un graphe, ainsi que leur points d’articulation, j’ai implémenté dans SCOTCHer l’algorithme développé par Tarjan (Tarjan, 1972). Cet algorithme, de la même manière que pour la recherche des composantes connexes d’un graphe, utilise un algorithme de parcours en profondeur de l’arbre. Une fois les composantes biconnexes mises en évidence, le protocole va consister à déterminer la combinaison optimale de rotamères pour chacune des composantes indépendamment, puis à les prendre en compte simultanément. Les composantes biconnexes sont traitées en fonction du nombre de point d’articulation qu’elles contiennent (les composantes ayant le plus petit nombre de points d’articulation sont donc traitées en premier). Ainsi, en considérant la Figure 61, la première composante à traiter est la composante A qui ne contient qu’un seul point d’articulation. Pour cette composante, la combinaison de rotamères donnant la plus basse énergie est sélectionnée (et ceci pour chacun des rotamères du point d’articulation), puis le point d’articulation est mis à jour en lui agrégeant la combinaison de rotamères optimales ainsi déterminée (le point d’articulation peut être considéré comme un « super résidu », contenant des combinaisons de rotamères ou « super-rotamères »). Ainsi, en traitant successivement chacune des composantes biconnexes, nous arrivons à déterminer la combinaison optimale de rotamères pour l’ensemble du graphe.

Lors d’une dernière étape, l’énergie d’interaction de chacun des modèles issus de la perturbation de la structure de départ est évaluée avec la fonction d’énergie FOLDX (Guerois et al., 2002; Schymkowitz et al., 2005). Enfin, après avoir déterminé le RMSD de chacun des modèles perturbés par rapport à la structure de départ, un graphe analysant l’énergie d’interaction des modèles en fonction de leur RMSD par rapport à la structure cible (« binding funnel plot ») est construit, puis la corrélation entre ces deux variables est mesurée.

Dans le document Prédiction structurale et ingénierie des assemblages macromoléculaires par bioinformatique (Page 132-137)