• Aucun résultat trouvé

AUTODOCK est constitué d’un ensemble de programmes et d’utilitaires exécutés en ligne de commandes sous environnement Unix. Nous avons rédigé un document de prise en main rapide du logiciel présentant la séquence de commandes à exécuter pour effectuer un calcul d’amarrage. Ce guide à l’usage des utilisateurs débutant avec AUTODOCK, permet de lancer rapidement les premiers calculs à partir des fichiers bruts du ligand et du récepteur. Des indications sur la nature et l’influence des différents outils et paramètres jalonnent la procédure ainsi que quelques recommandations. L’objectif de ce document, joint en Annexe II p.73, est de laisser une trace du savoir-faire acquis au cours de ce travail.

La procédure AUTODOCK se décompose en cinq étapes :

• préparation des fichiers de coordonnées atomiques du ligand et de la macromolécule ;

• définition des pivots flexibles du ligand ;

• calcul des grilles de potentiel d’interaction du récepteur ;

• recherche des solutions d’amarrage ;

• analyse des résultats.

1.PREPARATION DES FICHIERS.

La macromolécule doit être représentée avec ses hydrogènes polaires ainsi que les charges partielles de tous ses atomes. Cette opération peut se faire avec le logiciel SYBYL et son module BIOPOLYMER. A une structure PDB ou au résultat d’une construction par homologie avec COMPOSER, il ne faut ajouter que les hydrogènes dits « essentiels » c'est à dire polaires et assigner les charges Kollman United Atoms (KOLLUA)[18]. Pour les charges KOLLUA la charge des hydrogènes manquants est reportée sur les atomes qui les portent, évitant ainsi un déficit de charges. On peut également supprimer tous les doublets libres de la macromolécule. La protéine ainsi préparée est enregistrée dans un fichier au format mol2 (SYBYL) puis converti, avec l’utilitaire CNVMOL2TOPDBQ (fourni avec AUTODOCK), au format pdbq qui reprend le format pdb (Protein Data Bank) en y ajoutant une colonne pour les charges. On intègre ensuite les paramètres de solvatation des atomes de la macromolécule avec l’utilitaire ADDSOL qui génère un fichier pdbqs utilisable par AUTOGRID.

Le ligand doit comporter tous ses hydrogènes et toutes ses charges partielles. On peut calculer ces charges avec un logiciel implémentant une méthode empirique telle que celle de Gasteiger ou une méthode semi empirique utilisant l’hamiltonien AM1 par exemple. Le ligand est d’abord enregistré au format mol2.

2.DEFINITION DES PIVOTS FLEXIBLES DU LIGAND.

Les pivots qui seront en libre rotation durant la simulation doivent être désignés et les carbones aromatiques doivent être renommés dans le fichier de structure. L’utilitaire DEFTORS exécute cette dernière opération automatiquement et permet à l’utilisateur de sélectionner les pivots libres parmi la liste des pivots existant. DEFTORS prend le fichier de cordonnées atomiques du ligand au format mol2 et enregistre le résultat de son traitement au format pdbq.

3.CALCUL DES GRILLES DE POTENTIELS.

Les grilles de potentiels sont calculées par le programme AUTOGRID selon les instructions du fichier de paramétrage qu’on lui fournit. Le fichier de paramétrage est un fichier texte dont l’extension est gpf (Grid Parameters File). Les paramètres, codés par des mots clé, indiquent :

les noms de fichiers du ligand et de la macro, aux formats pdbq et pdbqs respectivement ;

• la position et les dimensions de la boîte ainsi que l’espacement entre les points de la grille (0,4 Å par défaut) ;

• les noms des types d’atomes présents dans le ligand et pour lesquels il faut calculer une grille ;

• la valeur des constantes des différents termes à calculer.

Chaque grille calculée est enregistrée dans un fichier dont l’extension est map. Le fichier de paramètres peut être généré automatiquement, par l’utilitaire MKGPF3, à partir des fichiers du ligand et du récepteur. La boîte est alors centrée sur le ligand et ses dimensions sont proportionnelles à la taille de ce ligand. Par conséquent, il est nécessaire d’éditer ce fichier généré pour modifier les paramètres de position et de dimension de la boîte afin de l’ajuster au mieux à la région du récepteur que l’on étudie. L’utilitaire MKBOX génère un fichier pdb des coordonnées de la boîte d’après les paramètres du fichier gpf ce qui permet de contrôler visuellement sa position par rapport au récepteur.

Les grilles ainsi calculées peuvent être réutilisées pour tout ligand ne comportant pas de nouveau type d’atome et devant explorer la même région de la macromolécule.

4.RECHERCHE DES SOLUTIONS D’AMARRAGE.

C’est le programme AUTODOCK qui va faire cette recherche en fonction des paramètres qu’on lui transmet par l’intermédiaire d’un fichier dpf (Dock Parameters File). Les paramètres d’un calcul d’AUTODOCK sont :

• les noms des fichiers contenant le ligand et les grilles de potentiels à utiliser ;

• l’état initial du ligand (position, orientation et conformation aléatoire ou précisée) ;

• la méthode de recherche à utiliser (RSMC, AG ou AGL) avec les paramètres associés et les paramètres de l’algorithme d’optimisation locale pour la méthode AGL.

Les paramètres de l’algorithme génétique sont :

• La taille de la population. La valeur standard est de 50 mais peut être modifiée en fonction du nombre de degrés de liberté et de l’étendue de la boîte à explorer.

• Le nombre maximum d’évaluations d’énergie. C’est un paramètre d’arrêt de l’amarrage utile lorsque le processus met trop de temps, ou ne parvient pas, à converger.

• Le nombre maximum de générations qui est un autre paramètre d’arrêt. Ces deux derniers paramètres sont à adapter conjointement en fonction de la taille de la population, du nombre de degrés de liberté, de l’étendue de la boîte à explorer et du degré de convergence à atteindre. Le degré de convergence est corrélé au nombre de solutions distinctes, ou classes, que l’on veut obtenir.

• Le niveau de sélection élitiste : le nombre des meilleurs individus qui survivent automatiquement à la génération suivante. La valeur standard est 1.

• Le taux de croisements. Le croisement est l’opérateur d’exploration globale, sa probabilité doit être élevée pour que l’AG ait ce caractère global. La valeur standard est 0,8.

• Le taux de mutations. Cet opérateur joue un rôle d’optimisateur local pour les AGs purs (darwiniens) en opérant des variations de faible amplitude sur les gènes, chose que le croisement fait très difficilement. Avec l’opérateur d’optimisation locale explicite des AGL, ce rôle devient inutile et la mutation sert seulement à réintroduire des allèles

éliminés par la sélection. Sa probabilité doit donc être faible dans un AGL. La distribution de Cauchy donne un compromis entre des variations radicales et une exploration trop détaillée de la topographie conformationnelle. La valeur standard est 0,02.

• Le nombre de générations précédentes N dans lesquelles on recherche l’individu le plus mal adapté pour calculer le facteur de sélection proportionnelle. Si cette valeur est trop grande, les plus anciennes générations qui sont peu optimisées, vont perturber la sélection en gommant les écarts entre les nouvelles solutions. Les meilleurs individus de la génération en cours n’auront pas beaucoup plus d’enfants que les moins bons individus et la population convergera très lentement. Si N est trop petit, la population convergera rapidement vers le minimum local le plus proche. On peut faire l’analogie entre ce paramètre et à un facteur d’échelle : si on est trop près du relief énergétique on n’en voit qu’une partie et on trouve une solution locale, si on est trop loin on ne distingue plus le relief. La valeur optimale est de 10 générations.

• Les valeurs de α et β, assimilables à la moyenne et la variance de la distribution de Cauchy pour la mutation des gènes. Les valeurs standard sont 0 et 1 respectivement.

• Le nombre de cycles à exécuter c'est-à-dire le nombre de solutions souhaitées.

Dans le cadre d’une recherche par AGL les paramètres de l’optimisateur local (Solis Wets) sont :

• Le nombre maximal d’itérations d’optimisation, 300 pour une petite molécule organique ;

• Le nombre de succès consécutifs de l’optimisation avant de modifier la taille du pas de l’opérateur. La valeur standard est 4.

• Le nombre d’échecs consécutifs de l’optimisation avant de modifier la taille du pas de l’opérateur. La valeur standard est 4.

• La taille du pas de l’opérateur sur les gènes de position : entre 0,2 Å et 1 Å.

• La taille du pas de l’opérateur sur les gènes d’orientation : entre 5° et 50°. Les multiples de 360 sont à écarter si l’on veut éviter de re-tester périodiquement les mêmes valeurs d’angle. Il est également souhaitable que ce pas soit un réel ou un entier grand, supérieur à 36, pour assurer l’exploration fine de ces gènes. Les pas de translation et de rotation sont des pas de recherche locale.

• La taille initiale de « l’espace de recherche locale ». C’est le facteur qui est doublé ou divisé par deux après quatre optimisations consécutives de même tendance et qui pondère

les pas de recherche locale. Sa valeur initiale est de 1 et ne devrait pas être modifiée par l’utilisateur.

• La taille limite inférieure de l’espace de recherche locale. C’est un paramètre d’arrêt de l’optimisation locale. Il indique la « finesse » d’optimisation en dessous de laquelle on ne descend pas. La valeur par défaut est de 0,01. A titre d’exemple, il faut au minimum 4x7 itérations d’optimisation pour que la taille de l’espace de recherche passe de 1 à 0,01.

• Le nombre maximum de cycles d’optimisation. Un cycle d’amarrage s’arrête soit :

• lorsque le nombre maximal de générations est atteint ;

• lorsque le nombre maximal d’évaluation d’énergie est atteint ;

• lorsque la population a convergé vers une unique solution.

A la fin de chaque cycle d’exploration, AUTODOCK enregistre la meilleure solution d’amarrage du cycle c’est à dire le phénotype de l’individu de la dernière génération ayant la meilleure interaction avec le ligand. Le fichier de résultats contiendra donc autant de solutions que de cycles exécutés. Ce fichier textuel porte l’extension dlg (Dock LoG).

5.ANALYSE DES RESULTATS.

AUTODOCK peut faire une première analyse des résultats en regroupant les solutions en classes (clusters) en fonction de leur proximité spatiale. La mesure de la proximité entre deux solutions est calculée par la racine de la moyenne des carrés des écarts (Root Mean Square Deviation – RMSD) de leurs coordonnées atomiques. Si le RMSD entre deux molécules est inférieure à une distance seuil, ces deux solutions sont dans la même classe. Le seuil de distance est appelé « tolérance de classe » et sa valeur par défaut, pour AUTODOCK, est de 0,5 Å. Ce paramètre est transmis à AUTODOCK par le fichier de paramétrage (dpf) avant le lancement de l’amarrage. Le résultat de l’analyse par classes figure sous forme d’histogramme à la fin du fichier de résultats. La meilleure solution est celle de plus basse énergie et une convergence de toutes les solutions vers la même classe paraît souhaitable. Malheureusement, un ligand peut adopter différents modes de liaison avec le récepteur et le modèle de l’énergie n’est pas parfait. Il est donc intéressant d’obtenir plusieurs classes sur une gamme d’une dizaine de kcal.mol-1. Elles peuvent révéler ces différents modes de liaison. Le nombre de classes obtenu dépend du degré de convergence de la recherche et c’est en jouant sur le nombre d’évaluations de l’énergie et le

C - APPLICATION : ETUDE DU MECANISME DE RECONNAISSANCE