• Aucun résultat trouvé

Au cours de ma thèse, j’ai réalisé les calculs de docking moléculaire avec le logiciel ATTRACT, développé en 2003 par Martin Zacharias (126). Cet algorithme est basé sur une représentation simplifiée, dite gros grain des protéines, et utilise une fonction de score composée d’un terme de Lennard-Jones pour modéliser les interactions de van der Waals, et d’un terme de Coulomb pour représenter les interactions électrostatiques. Le docking moléculaire est réalisé par minimisation d’énergie dans les six degrés de liberté rotationnels et translationnels (voir section 2.2.3.1) à partir de milliers de conformations de départ générées de manière homogène autour de la surface du récepteur.

5.2.1 Représentation des protéines

La représentation des protéines se fait avec un modèle gros grain des résidus. L’utilisation d’un tel modèle permet de diminuer la complexité du système, et donc de réduire de manière conséquente le temps de calculs, qui est l’une des limites principales du docking. Cette représentation simplifiée se traduit par un nombre plus faible de minimum locaux par rapport à un modèle de représentation protéique tout-atome, et permet donc une convergence beaucoup plus rapide lors des étapes de recherche de minimum d’énergie (du fait du plus petit nombre de minima locaux).

Les acides aminés sont représentés par trois ou quatre pseudo-atomes selon leur type. Pour chaque résidu, la chaîne principale est représentée par deux pseudo-atomes (un est positionné sur l’atome d’azote, l’autre sur l’atome d’oxygène) (Figure 5.1), les propriétés de ces deux pseudo- atomes sont les mêmes quelque soit la nature de l’acide aminé. La chaîne latérale des petits acides aminés (Ala, Asp, Asn, Cys, Ile, Leu, Pro, Ser, Thr, et Val) est représentée par un unique pseudo- atome situé au centre de masse des atomes lourds la composant. Les chaînes latérales des autres acides aminés (Tyr, Phe, Gln, Glu, Lys, Arg, Met, His) sont représentées par deux pseudo-atomes, ce qui permet de prendre en compte leur forme et propriétés chimiques spécifiques (136). La Glycine est un cas particulier, ne possédant pas de chaîne latérale elle est représentée par les seuls deux pseudo-atomes du squelette.

Figure 5.1. Représentation de l’ubiquitine avec un modèle tout atome et avec le modèle gros grain d’ATTRACT. (A) Modèle protéique de l’ubiquitine (pdb 1xd3, chaîne B) à une résolution

atomique. Chaque sphère représente un atome lourd (les atomes d’hydrogène ne sont pas représentés). (B) Représentation de la même protéine avec le modèle gros grain d’ATTRACT. Chaque sphère représente un pseudo-atome. Les deux figures ont été réalisées avec le logiciel PyMOL (190).

5.2.2 Fonction de score

La fonction de score d’ATTRACT est composée d’un terme de Lennard-Jones pour modéliser les forces de van der Waals et un terme de Coulomb pour modéliser les interactions électrostatiques. ATTRACT a la particularité d’employer un champ de forces permettant des interactions attractives entre paires d’atomes (voir équation (1)) mais aussi purement répulsives (voir équations (2) et (3)).

Les interactions entre deux pseudo-atomes A et B sont modélisées par les équations suivantes : - Cas de paires attractives :

V =εAB

[

(

RAB rij

)

]

8 −

[

(

RAB rij

)

]

6 +qiqj ε rij (1)

- Cas de paires répulsives :

V =−εAB

[

(

RAB rij

)

]

8 −

[

(

RAB rij

)

]

6 +qiqj ε rij si rij>rmin (2) V =2 eminAB

[

(

RAB rij

)

]

8 −

[

(

RAB rij

)

]

6 +qiqj ε rij si rijrmin (3)

avec RAB et εAB des paramètres spécifiques à chaque couple de pseudo-atomes, ε une constante

A, qj la charge du pseudo-atome B. rmin correspond à la distance entre les deux atomes à laquelle un

minimum d’énergie est atteint pour les paires attractives, ou un point de selle pour les paires répulsives (figure 5.2). emin correspond à l’énergie à la distance rmin entre les deux atomes A et B

(figure 5.2). Pour plus de détails, se référer à la publication originelle de Fiorucci et Zacharias (142)).

Figure 5.2. Représentation des deux formes de la fonction de score d’ATTRACT. La courbe

continue représente le cas d’une paire attractive d’atomes avec un minimum d’énergie emin à la

distance rmin. La courbe en pointillés représente le cas d’une paire répulsive avec un point de selle

emin à la distance rmin. Figure extraite de Chéron et al (191).

5.2.3 Procédure de docking d’ATTRACT

Les calculs de docking réalisés avec ATTRACT suivent la procédure suivante :

- Des points de départ du ligand sont positionnés autour du récepteur par un algorithme modifié de Shrake et Rupley (69). Ces points de départ sont placés à la surface du récepteur à une distance légèrement supérieure au rayon de giration du ligand, afin d’éviter des recouvrements stériques entre les deux protéines au départ de la procédure de minimisation (Figure 5.3). Le nombre de points de départ est directement dépendant du rayon de giration du ligand, ainsi que de la surface totale du récepteur. Pour chacun de ces points de départ, 220 orientations différentes du ligand sont générées. Selon la taille du récepteur, plusieurs milliers à plusieurs dizaines de milliers de conformations de départ sont ainsi créées.

Figure 5.3. Exemple de positionnement des points de départ autour de la surface du récepteur.

Le récepteur est représenté en bleu. Les positions de départ sont représentées par des sphères oranges. Elles sont placées de manière homogène autour de la surface du récepteur. Pour chaque position de départ 220 orientations différentes du ligand sont générées.

- Pour chacune des conformations de départ, plusieurs séries de minimisations d’énergie sont réalisées (généralement cinq) jusqu’à convergence dans un minimum local (voir section 5.2.3). Lors de la première étape de minimisation, une contrainte harmonique entre le centre de masse du récepteur et le pseudo-atome le plus proche du ligand est appliquée. Cette contrainte a pour but de rapprocher et de mettre en contact les deux protéines. Les étapes de minimisation suivantes permettent à la structure du ligand de converger dans un minimum local d’énergie. Il est à noter que, du fait de la manière dont ATTRACT est implémenté, plusieurs séries de minimisations sont nécessaires. En effet, pour évaluer les conformations obtenues, ATTRACT établit des listes de paires de pseudo-atomes n’appartenant pas à la même molécule (non liés). C’est à partir de ces listes de paires qu’est calculé le score de la conformation. Du fait de la modification des coordonnées du ligand par rapport au récepteur lors d’une série de minimisation, cette liste de paires de pseudo-atomes devrait être mise à jour à chaque pas de minimisation. Cependant cette procédure est coûteuse en temps de calcul. En conséquence, afin de réduire le coût computationnel, les listes de paires de pseudo-atomes ne sont générées qu’au début de chaque série de minimisation, puis remises à jour une dernière fois, une fois la convergence obtenue, pour l’évaluation finale de la conformation. De plus, durant ces étapes de minimisation, une limite sur les distances pour l’établissement des listes de paires de pseudo-atomes est fixée. Par exemple, avec une limite de 7Å, la liste créée n’inclura que des paires de pseudo-atomes distants de moins de 7Å. Cela permet d’éviter de réaliser un grand nombre de calculs sur des paires d’atomes très éloignées, et donc

n’influant pas sur le score final de la conformation. Cette limite permet de limiter les temps de calculs de manière très efficace. Les temps de calculs pour un couple de protéines sont du même ordre de grandeur que ceux de ZDOCK (129) ou FRODOCK (128).

5.2.4 Pourquoi ATTRACT ?

Au cours de cette thèse j’ai choisi d’utiliser le logiciel ATTRACT car nous avions besoin d’un outil (i) explorant de manière exhaustive la surface du récepteur et du ligand et (ii) pouvant réaliser cette exploration rapidement.

Beaucoup d’algorithmes, tels que HADDOCK (125), sont conçus pour être utilisés sous contraintes et ne permettent pas d’exploration exhaustive des surfaces protéiques à un coût computationnel acceptable. D’autres algorithmes comme ZDOCK (129) reposent sur l’utilisation de FFT pour réaliser un échantillonnage exhaustif des modes d’interactions entre les protéines mises en jeu. Plusieurs millions de conformations sur l’ensemble de la surface du récepteur peuvent ainsi être générées. Cependant, dans le cadre de notre étude, cette méthodologie présente des défauts: étant donné le très grand nombre de conformations analysées, seul un certain nombre d’entre elles (celles ayant les meilleurs scores) sont accessibles à l’utilisateur. Leur répartition n’est pas homogène sur la surface du récepteurs, les solutions étant généralement concentrées sur certaines régions du récepteur. Il serait bien entendu possible de prendre en compte un nombre supérieur de conformations jusqu’à obtenir un couverture totale de la surface du récepteur, mais cette méthodologie serait lourde du point de vue computationnel. La méthodologie employée par ATTRACT est donc mieux adaptée pour le problème qui nous intéresse. Nous avons estimé qu’ATTRACT permettait un échantillonnage et une évaluation rapide des surfaces protéiques et était donc un bon compromis.