• Aucun résultat trouvé

Le résultat d'une dynamique moléculaire dépend des conditions initiales, basées sur dié-rents paramètres mais aussi sur la conformation de départ et le jeu de vitesses initiales, qui suit une distribution de Maxwell-Boltzmann obtenue à partir d'un générateur de nombre aléatoire.

Classiquement, la mise au point d'une simulation se déroule de la manière suivante :

1. Construction du système : Les coordonnées atomiques initiales sont obtenues à partir des structures tridimensionnelles à haute résolution, résolues par cristallographie aux rayons X ou par RMN. Elles sont disponibles sur la RCSB Protein Data Bank (PDB) [8]. Les atomes manquants, classiquement les hydrogènes, sont modélisés. Des contre-ions sont ajoutés pour neutraliser les systèmes chargés, en utilisant une grille de potentiel de Coulomb dans un

rayon de 4 Å autour de la biomolécule. Le système est ensuite placé au centre d'une boîte périodique avec un solvant explicite ou implicite pré-équilibré. Dans le cas d'un solvant explicite, les molécules d'eau sont modélisées généralement avec le modèle TIP3P [160]. Le volume du soluté est découpé dans cette boîte en retirant les molécules de solvant chevauchantes, dont au moins un atome est situé à moins de 1 Å du soluté. Dans le cas de solvant implicite, les molécules d'eau ne sont pas modélisées, mais leur eet est mimé en changeant la constante diélectrique εij du milieu par celle de l'eau, dans l'expression du potentiel électrostatique.

2. Minimisation de l'énergie : Le plus souvent, les points de départ des simulations de dynamique moléculaire sont des structures de biomolécules obtenues par RMN ou par cris-tallographie aux rayons X. Les longueurs et angles de liaisons de ces structures ne sont pas forcément compatibles avec les valeurs dénies dans le champ de force. Par ailleurs, suite à des erreurs ou au manque de données expérimentales, les structures peuvent présenter des défauts : superposition des atomes, coordonnées atomiques manquantes... Ces défaults et ce manque d'adéquation au champ de force induit des valeurs trop grandes de l'énergie potentielle et de son gradient. Les forces appliquées sur le système sont alors trop grandes, ce qui donne des accélérations trop élevées, et fait bouger les atomes de manière violente, ce qui déstabilise la simulation numérique. Pour obtenir un point de départ énergétique-ment réaliste et énergétiqueénergétique-ment compatible avec le champ de force, la première étape d'une simulation consiste à relaxer le système par une étape de minimisation d'énergie, qui va détecter un minimum énergétique local. Il existe plusieurs algorithmes de minimisation. Les méthodes d'ordre 0 utilisent simplement des évaluations de la fonction d'énergie. Les méthodes d'ordre 1 utilisent la dérivée première de la fonction f (gradient). La méthode de la plus grande pente (Steepest Descent) et celle du gradient conjugué en font partie. Enn, les méthodes d'ordre 2 utilisent le gradient et le Hessien (dérivée seconde) de f (Newton-Raphson, Quasi-Newton, Newton-tronqué...). Plus l'ordre est grand et plus l'algorithme est précis, mais plus il consomme de ressources (CPU, mémoire). En général, une combinaison de la méthode de la plus grande pente (Steepest Descent) et du Gradient conjugué est uti-lisée. Dans un premier temps, la méthode de la plus grande pente permet de tendre plus rapidement vers un minimum d'énergie local. Puis la méthode du gradient conjugué sert à aner la minimisation pour une meilleure convergence vers ce minimum local.

3. Thermalisation - Equilibration - Production : Pour rétablir une densité optimale après l'introduction de la protéine dans la boîte de solvant, une étape d'équilibration est néces-saire. Le système est donc d'abord chaué à la température souhaitée avec des contraintes harmoniques sur les positions atomiques du soluté. Le système est ensuite équilibré à vo-lume constant puis à pression constante pour ajuster le vovo-lume et corriger la densité de la boîte. Les contraintes harmoniques sont relachées progressivement. À la n de cette étape, le système est prêt à être simulé dans un ensemble thermodynamique choisi, et produire ainsi une trajectoire de DM.

NVE, est réalisé à nombre d'atomes N, volume V et énergie totale E du système constants. L'ensemble canonique NVT est réalisé dans les mêmes conditions, mais avec une tempéra-ture T constante et une énergie totale du système variable. L'ensemble isotherme-isobare, plus connu sous le nom NPT, est réalisé à pression P et température T constantes. Enn, dans l'ensemble grand-canonique, ou µVT, le potentiel chimique µ, le volume et la tempé-rature sont constants, laissant ainsi l'énergie et le nombre d'atomes uctuer au cours de la simulation.

Dans les dynamiques moléculaires de système protéique, un ensemble très utilisé est l en-semble NPT. La température T est reliée à l'énergie cinétique Ec :

Ec = N X i=1 1 2miv 2 i = kbT 2 (3N − Nc) (III.11)

avec N le nombre d'atomes, (3N −Nc)le nombre de degré de liberté, mi la masse atomique, kb la constante de Boltzmann. La température peut être contrôlée en modiant les vitesses vi des atomes et molécules du système. Par exemple, les vitesses peuvent être ajustées de manière à avoir T = Tref à chaque pas. L'algorithme de Berendsen [161] par exemple, ajuste les vitesses à un taux proportionnel à la diérence de température.

La pression est reliée au volume du système et aux interactions entre atomes : P V = NkbT. Elle peut donc être contrôlée en faisant varier le volume du système et en ajustant la position des atomes les uns par rapport aux autres.

2 La dynamique moléculaire avancée

Comme il a été décrit dans la section précédente, le potentiel utilisé pour une simulation de dynamique moléculaire requiert l'utilisation d'un très petit pas d'intégration, de l'ordre de la femtoseconde. De ce fait, le temps réel de simulation est relativement limité et constitue un obstacle majeur dans l'étude de changements conformationnels. En eet, la plupart des fonctions biologiques dans la cellule se produisent sur une échelle de temps allant de la microseconde à la milliseconde. Or les ressources informatiques, bien qu'elles se soient énormément développées ces dernières années, ne permettent de simuler des gros systèmes que sur quelques centaines de nanosecondes. D'autre part, les réarrangements conformationnels induits par ces mouvements et interactions sont associés à des barrières énergétiques importantes, qui ne peuvent généralement pas être traversées par des simulations de DM classique.

Pour palier ce problème, de nombreuses approches ont été développées. Elles se divisent princi-palement en deux classes, l'une étant fondée sur la mécanique moléculaire, l'autre sur la dynamique moléculaire. Quelques unes d'entre elles sont présentées dans les sections suivantes.