• Aucun résultat trouvé

Chapitre 4 : Prédiction des assemblages macromoléculaires

4.4. SCOTCH : une nouvelle méthode pour prédire la structure des assemblages protéiques

4.4.6. Le programme RosettaDock

Parmi les méthodes les plus efficaces de docking à l’heure actuelle, figure le programme RosettaDock (Gray et al., 2003). Ce programme, dispose de deux fonctions de score : (i) une fonction de score à basse résolution, issue d’un couplage entre un potentiel statistique, et une fonction d’énergie à basse résolution qui représente les chaînes latérales d’un résidu sous forme d’un centroïde, (ii) une fonction de score à haute résolution, reposant sur une fonction d’énergie prenant en compte explicitement chaque atome de chaque résidu. Au cours des premières étapes de la procédure RosettaDock basées sur une recherche de type corps-rigide, la fonction à basse résolution, peu coûteuse en temps de calcul, est utilisée. Après cette recherche à basse résolution, une optimisation locale de la structure avec une précision atomique est réalisée. Lors de cette étape, plus coûteuse en temps de calcul, la fonction d’énergie à haute résolution est utilisée (Gray et al., 2003).

Pour comparer l’efficacité de ces deux fonctions de score de RosettaDock (score « centroïde » pour la basse résolution et score « tout atome » pour la haute résolution), j’ai tout d’abord évalué leur capacité à reconnaître la structure native d’un complexe, parmi un ensemble de conformations alternatives. Pour cela, j’ai considéré à nouveau la base de données inter- moléculaire de 11 complexes, ainsi que les 10000 modèles générés par FTDock (Gabb et al., 1997) pour chacun de ces complexes. J’ai ensuite calculé pour chaque structure native, et chacun des modèles, le score centroïde ainsi que le score tout atome par le programme RosettaDock (Gray et al., 2003) (voir section 7.2.1). Le Tableau 9 présente, pour chaque cas, les pourcentages de modèles mieux classés que la structure native. Comme nous pouvons le constater, la structure native est toujours mieux classée par la fonction à haute résolution du programme RosettaDock, ce qui traduit le fait que cette fonction est très efficace pour reconnaître la structure native des complexes (Tableau 9). La fonction à basse résolution, bien que moins efficace, parvient cependant à classer dans la plupart des cas la structure native parmi les meilleures. En effet, très peu de modèles sont mieux classés que la structure

native (moins de 5% des modèles sont mieux classés que la structure native pour 9 cas sur 11, voir Tableau 9).

Méthodes Identifiant PDB

1AY7 1B6C 1BUH 1E6E 1EAW 1EWY 1FQJ 1GRN 1I2M 1IBR 2PCC

a

0.13 0.06 6.99 0.05 1.41 0.01 3.17 0 0.54 0.05 21.21

b

0 0 0 0 0 0 0 0 0 0 0

a

Fonction de score à basse résolution de RosettaDock (Centroïde)

b

Fonction de score à haute résolution de RosettaDock (Tout atome)

Tableau 9. Pourcentage de modèles mieux classés que la structure native par les fonctions de score du programme

RosettaDesign (Gray et al., 2003). La base de données considérée est la base de validation inter-moléculaires de 11 complexes issus de la banque WENG dans leur état « liés » (Chen et al., 2003). Pour chacun de ces cas, 10000 modèles d’assemblage ont été générés par le programme FTDock (Gabb et al., 1997), puis évalués par les fonctions de score à basse résolution et à haute résolution du programme RosettaDesign (Gray et al., 2003). Pour chacun des cas, la structure native a ensuite été évaluée de la même façon, et le pourcentage de solutions mieux classées qu’elle a été déterminé.

Dans un second temps, j’ai évalué la capacité de ces deux fonctions de score, à reconnaître des structures proches des complexes natifs, générées par des approches de docking. Lors des premières étapes de docking moléculaire, un ensemble de solutions sont générées, mais leur précision n’est pas toujours très bonne. Il est donc essentiel de sélectionner par des fonctions de score discriminantes, les solutions les plus proches des structures natives de complexes. Pour chacun des cas de la base de données test, j’ai donc évalué les 10000 modèles produits par le programme FTDock avec les deux fonctions de score du programme RosettaDock, puis déterminé le classement du modèle le mieux classé, à moins de 3 Å de la structure native. Nous pouvons constater que cette fois, la fonction à basse résolution du programme RosettaDock est beaucoup plus efficace que la fonction à haute résolution. En effet, pour 9 cas sur 11, un modèle proche de la structure native est classé parmi les 100 meilleurs modèles par la fonction centroïde de RosettaDock, alors que seuls 2 cas sur 11 remplissent ce critère si l’on considère la fonction à haute résolution du programme (Tableau 10).

Methode Identifiant PDB

1AY7 1B6C 1BUH 1E6E 1EAW 1EWY 1FQJ 1GRN 1I2M 1IBR 2PCC

a

5 34 43 48 80 42 28 8 107 65 189

b

162 408 905 2732 98 446 157 320 396 62 3759

a

Fonction de score à basse résolution de RosettaDock (Centroïde)

b

Fonction de score à haute résolution de RosettaDock (Tout atome)

Tableau 10. Classement du premier modèle proche de la structure native du complexe par les fonctions de score du

programme RosettaDesign (Gray et al., 2003). La base de données considérée est la base de validation inter-moléculaires de 11 complexes issus de la banque WENG dans leur état « liés » (Chen et al., 2003). Pour chacun de ces cas, 10000 modèles d’assemblage ont été générés par le programme FTDock (Gabb et al., 1997), puis évalués par les fonctions de score à basse résolution et à haute résolution du programme RosettaDesign (Gray et al., 2003). Le classement du modèle le mieux classé, à moins de 3 Å de la structure native est indiqué dans le tableau pour chacun des cas testé.

Les fonctions d’énergie à haute résolution, très efficaces pour reconnaître les structures natives de complexes protéiques, vont pénaliser de façon importante les éventuelles interpénétrations atomiques impliquant des chaînes latérales ou des atomes du squelette peptidique. Ces approches ne sont donc généralement pas adaptées lors des premières étapes de docking, au cours desquelles les modèles produits ne sont pas de très bonne qualité.