• Aucun résultat trouvé

Implémenter le VS protéine-ligand basé sur la représentation FG

Les représentations SH ont aussi bien été utilisées pour représenter les formes de petites molécules que pour caractériser avec succès les formes des surfaces des poches liées de la protéine (Cai et al., 2002; Morris et al., 2005) et pour exécuter du VS à haut-débit basé sur le récepteur (Yamagishi

et al., 2006). Cependant, il n’est pas encore clair si les représentations SH des surfaces permettent

exactement d’apparier les formes de ligands avec des poches protéiques car, mathématiquement, la représentation de l’enveloppe de la surface ne permet pas de résoudre la partie translationnelle du problème d’appariement. À mon avis, on doit utiliser des représentations SPF 3D plus sophistiquées, semblables à celles utilisées dans Hex, afin de donner un niveau de sensibilité plus élevé dans un filtre HTVS tout en évitant le recours à des facilités HPC trop coûteuses. En outre, parce qu’il a été suggéré que l’appariement 3D basé sur la forme du ligand peut être, en fait, supérieur à celui d’amarrage dans un contexte de VS (Hawkins et al., 2007), il y a une forte motivation et l’espoir de retombées importantes dans le développement des approches SPF pour les filtres HTVS de ligands. Bien que les fonctions GL radiales de base décrites ici fonctionnent très bien pour l’amarrage pro-téique, je crois que la méthode calculatoire la plus utile pour représenter et comparer les formes 3D de petites molécules est d’employer les expansions SPF dans lesquelles les fonctions GL radiales de base existantes sont remplacées par les polynômes Gegenbauer. Il y a deux raisons principales pour lesquelles je crois que les polynômes Gegenbauer donneront un ensemble de base plus approprié avec lequel on puisse développer de nouvelles techniques HTVS 3D récepteur et ligand. Première-ment, ces polynômes n’ont pas un facteur de désintégration exponentiel comme les polynômes GL, mais leur domaine normal est l’unité hypersphère. Cela signifie qu’avec le choix approprié d’un facteur d’échelle, les polynômes Gegenbauer permettront d’encoder un certain niveau de détails en utilisant des expansions de l’ordre inférieur de manière plus compacte qu’avec les fonctions GL. Deuxième-ment, parce qu’un théorème d’addition existe pour les polynômes Gegenbauer (Srinivasan et al., 2005), il devrait être possible de calculer les effets de translation et ceux de rotation en transformant

seulement les coefficients d’expansion originaux, comme cela est le cas actuellement pour les fonc-tions GL de base existantes. À ma connaissance, il n’existe pas un théorème de translation pour les polynômes Zernike. Par conséquent, en dépit des résultats prometteurs récents avec la représen-tation de forme invariable à la roreprésen-tation de Zernike (Mak et al., 2008; Sael et al., 2008; Venkatraman

et al., 2009), la base Zernike semblerait être moins attrayante que les bases GL ou Gegenbauer. Il

est important de noter que les descripteurs prétendus invariables à la rotation peuvent être obtenus trivialement à partir de toutes ces expansions de base orthonormées simplement en additionnant les valeurs des coefficients d’expansion (Mavridis & Ritchie, 2009).

De toute façon, les considérations ci-dessus sont importantes parce que le coût de calcul des coefficients d’expansion SPF est de l’ordre de O(N3), et le coût de rotation et translation de ces représentations est pratiquement de l’ordre deO(N4)etO(N5), respectivement, où N est l’ordre du polynôme de l’expansion. Par conséquent, en choisissant judicieusement le type d’expansion radial et le facteur d’échelle, on peut réduire l’ordre d’expansion et ainsi accélérer de manière significative les calculs de l’appariement de formes et d’amarrage sans sacrifier la résolution.

On envisage que le nouveau programme “3D-Snap” pourra être utilisé en mode ligand ou ré-cepteur, ou les deux, pour le criblage. En d’autres termes, si l’entrée est une petite molécule, le programme cherchera dans sa base de données des molécules semblables en utilisant des corréla-tions rotationnelles de superposition 3D. Si l’entrée est une protéine cible, le programme cherchera des molécules qui peuvent se lier dans un site de liaison spécifié de la protéine cible. Dans ce cas, le site de liaison sera indiqué en donnant les coordonnées et le rayon d’un atome factice sur la protéine, par exemple. Si l’entrée est un complexe protéine-ligand existant, le programme cherchera dans sa base de données des ligands semblables et il les liera alors dans un site indiqué par la position du ligand. Il sera possible de chercher dans la base de données en utilisant des modes de filtrage différents. Par exemple, pour une certaine requête de forme, des comparaisons ultra-rapides invari-ables à la rotation seront utilisées pour éliminer presque instantanément une grande proportion de la base de données. Un appariement plus sensible sera alors effectué en utilisant des corrélations ro-tationnelles explicites FFT. Quand cela sera approprié, des corrélations d’amarrage récepteur-ligand seront appliquées seulement aux ligands candidats qui auront passé les filtres initiaux de forme. Par conséquent, il sera nécessaire d’exécuter des calculs d’amarrage complets seulement sur un sous-ensemble relativement petit de la base de données.

Avec un certain site de liaison d’un ligand, la version courante de Hex peut effectuer l’amarrage en corps-rigide en environ une minute parce que le calcul se réduit en grande partie à une corrélation rotationnelle dans laquelle le ligand tourne à l’intérieur du site de liaison et seule une recherche de translation limitée est nécessaire pour accomplir la manoeuvre d’amarrage. Cependant, Hex n’est pas conçu pour accéder à une base de données ou pour travailler avec un processus de filtrage, et il serait inapproprié de surcharger sa structure. Par conséquent, on propose le nouveau programme 3D-Snap. Néanmoins, 3D-Snap sera largement implémenté en adaptant et en réutilisant une grosse partie du

code source de Hex. En utilisant de nouvelles représentations de forme FG du ligand et seulement une zone relativement petite de la protéine centrée sur le site de liaison, il sera possible d’exécuter des corrélations d’appariement ou d’amarrage très rapides mais exactes. L’approche globale est illustrée schématiquement dans la figure 5.1. D’après les expériences précédentes, on s’attend à ce que chaque corrélation d’amarrage ne requière que quelques secondes de processeur.

Figure 5.1: Une illustration schématique du calcul de corrélation d’amarrage protéine-ligand FG proposé. À gauche : un domaine du récepteur de fibroblast growth factor (FGFRK) avec un ligand ATP analogue près du site de liaison du ligand (code PDB 1AGW). Centre : Représentations FG du ligand et de la zone locale autour du site de liaison du ligand FGFRK. À droite : le complexe FGFRK-ligand calculé. Puisque le site de liaison du ligand est normalement connu a priori, il n’est pas nécessaire d’analyser la surface entière de la protéine pendant l’amarrage. Autrement, une corrélation SPF rapide peut être faite en tournant et en translatant le ligand à l’intérieur d’une petite zone sphérique locale au site de liaison (centre). Cette illustration est faite en utilisant des fonctions GL au lieu des fonctions hypersphériques de base FG proposées.

Bien que j’aie beaucoup d’expérience en calcul et en théorie des fonctions spéciales, un travail non trivial est à prévoir pour développer les expressions de translation nécessaires pour exploiter au maximum l’approche FG proposée. Et il est difficile de prédire combien de temps cela pourrait pren-dre. Je n’ai pas prévu qu’un post-doctorant puisse entreprendre cette partie du projet. Néanmoins, il convient de noter que ni 3D-Blast ni 3D-Snap ne dépendent absolument des fonctions de base FG pour leur succès. Ainsi, le développement et le test du programme de ces deux projets peuvent s’accomplir en utilisant les fonctions de base GL existantes dans Hex.

Cette approche sera développée et évaluée en utilisant des données HTVS sur les protéines cibles et les ligands, comme celles fournis par les données publiques de DUD (“directory of useful decoys”) et de ZINC (Irwin & Shoichet, 2005; Huang & Shoichet, 2006). Bien que les calculs proposés pour l’amarrage protéine-ligand ne soient pas aussi exacts qu’AutoDock, cette approche fournirait un filtre additionnel rapide qui pourrait précéder l’étape conventionnelle de l’amarrage protéine-ligand basée sur le champ de forces. Je crois qu’en construisant un processus de filtrage et d’amarrage utilisant des représentations FG 3D et des techniques de corrélation SPF 3D et 5D rapides, il sera possible d’analyser des millions de ligands avec une exactitude comparable à celle d’AutoDock en environ 24 heures sur du matériel GPU moderne très abordable (détaillé dans la section suivante). Si l’on atteint avec succès ce niveau de performance, cela révolutionnerait la découverte structurale de médicaments.