1
Modélisa)on Mul)-échelle:
Modélisa)on des Macromolécules biologiques Séance 5 (1H30)
Cours de Master M2 Isabelle Navizet
Isabelle.navizet@u-pem.fr
Laboratoire Modélisa7on et Simula7on Mul7-Echelle (MSME)
2
Résumé des cours 1, 2, 3 et 4
• Modélisa7on: Mo7va7on
• Visualisa7on des protéines (VMD TP1)
• Champs de forces
• Protona7on des protéines (H++ et VMD TP2)
• Algorithmes de minimisa7on
• Algor7hmes de dynamique moléculaire (MD)
• Mise en place d’une MD: 1.traitement du solvant
• Prépara7on d’une MD (leap TP3)
3
Condi&ons périodiques aux limites
2. Condi)ons aux limites
Pas de condi7on aux limites (=vide ou solvant implicite) tend à compacter le système Modèle de taille limitée:
nécessité de préciser les condi7ons aux limites pour reproduire au mieux le système réel
Simula7on d’un système infini par réplica7on du système dans toutes les direc7ons
On calcule alors les interac7ons seulement entre les atomes de la cellule centrale et ses voisines immédiates
- Une des meilleures méthodes disponibles
- Très coûteuses pour des systèmes de grande taille
source h\p://realwireless.wordpress.com/2008/06/03/hexagons-in-3d-is-it- 7me-to-update- the-defining-image-of-the-cellular-industry/
2
5
Gestion des bords : vide
• Pas de solvant : interface avec le vide !
• Problèmes:
– Simulations non réalistes
– La tension de surface tendra à rendre le système plus compacte (sphérique) afin de diminuer la surface moléculaire
• Déformations de molécules non sphériques e.g. ADN – Pas d’écrantage des charges par le solvant
• Solutions possibles
– Modèle de solvant implicite (e.g. constante diélectrique dépendante de la distance)
– Ajout de forces stochastiques pour mimer le solvant sur les atomes de surface
– Simuler explicitement les molécules de solvant (solvant explicite)
PF 02/2010
6
• La boîte de simulation est répliquée dans toutes les directions de l’espace
• Les particules quittant la boîte centrale sont
réintroduites du côté opposé
• Les interactions sont calculées avec les particules des cellules voisines
Conditions périodiques aux limites
PF 02/2010
7
Formes de boîte
PF 02/2010
Formes de boîte (2)
PF 02/2010
8
Truncated octahedron
Rhombic dodecahedron
source http://realwireless.wordpress.com/2008/06/03/hexagons-in-3d-is-it-time-to-update- the-defining-image-of-the-cellular-industry/
cubique
Forme des boites d’eau pour les simula7ons de protéines
4
5
3. Traitement des interactions non liées : cut-off
Termes liés ∝ N
Termes non liés ∝ N² partie la plus coûteuse d’une simulation
Les interactions électrostatiques et de vdW décroissent avec la distance interatomique rij on les néglige pour rij > cut-off
Approximation - valable pour vdW (décroît en 1/r6)
- moins valable pour elec (décroît en 1/r)
Cut-off ~ 10 Å
Avec les conditions périodiques aux limites, le cut-off doit être tel que chaque particule ne puisse pas voir sa propre image
cut-off < (plus petite longueur de boîte)/2
Interac7ons intramoléculaires
• La modélisa7on des interac7ons intramoléculaire consiste aux élonga7ons de liaisons (2 par7cules impliquées, au maximum 4 ou rarement 6 atomes liées chimiquement à un atome donné ⇒ ≤ 6 interac7ons par atome), et aux angles impliquant 2 ou trois autres atomes à proximité.
• Chaque atome intervient dans le calcul de l’ordre de 10-20 interac7ons intramoléculaires, l’effort total pour les interac7ons intramoléculiaire tcalc,inter ∝ N.
Le réseau de liaisons ne change pas pendant la simula7on ⇒ les voisins de chaque par7cule sont connus et leurs indices peuvent être stockés dans une liste de voisins établie une fois au début du calcul.
Interac7ons non-liantes
• Le calcul de la contribu7on des interac7ons non-liantes entre et dans les molécules consomme la plus grande par7e de l’effort de calcul des forces tcalc,inter >> tcalc,intra.
• Pour un poten7el d’interac7on de portée limitée (V(r) ∝ r−k,k > 3) il est jus7fiable de se limiter aux interac7ons avec les Nv par7cules qui sont dans une sphère de rayon rc autour de la par7cule i.
• Le rayon rc doit être pris suffisamment grand pour minimiser la différence par rapport à un calcul complet de la force.
• Pour l’interac7on Lennard-Jones le rayon de tronca7on rc est typiquement pris entre 8-10 Å.
Troncature et switch
Liste de voisins
• On peut exploiter une tronca7on de l’interac7on en calculant l’ensemble des distances pour ensuite évaluer seulement les interac7ons entre paires de par7cules suffisamment proches.
• On gagne du temps dans l’ évalua7on du poten7el d’interac7on mais on doit toujours calculer les N (N − 1)/2 distances rij.
• La technique de tronca7on devient vraiment intéressante si on arrive à éliminer l’effort ∝ N2 du calcul des distances (au moins par7ellement).
• Une technique introduite par L. Verlet est la construc7on d’une liste de voisins.
Un calcul de l’ensemble des distances est u7lisé pour compiler des listes d’autres par7cules qui sont dans le rayon rc autour d’une par7cule i (effort ∝ N2).
Dans un système peu mobile (crystal) ce\e liste peut rester valable pendant toute la simula7on.
Dans un liquide le mouvement des par7cules demande des mises à jour de la liste (par7cules entrant ou sortant de la sphère d’interac7on). Chaque version de la liste est u7lisée pendant plusieurs pas de dynamique.
• Pour éviter la reconstruc7on de la liste à chaque pas on construit la liste en incluant une couche supplémentaire (’skin’) de rayon r
l.
• La reconstruc7on de la liste est déclenchée par
un compteur qui accumule les déplacements des
par7cules (effort ∝ N). Dans la pra7que cela
conduit à des intervalles d’environ 10 pas
d’intégra7on.
• A des densités liquides typiques chaque par7cule a environ 75 voisins. Chaque voisin entre dans deux interac7ons de paires et il suffit de stocker de l’ordre de 40 voisins par par7cule en moyenne et alors prévoir un espace de stockage total de l’ordre de 40N en7ers.
• La technique des listes est difficile à vectoriser et à paralléliser.
Interac7ons de longue portée
• Les techniques pour le traitement correct les interac7ons de longue portée V (r) ∝ r
−k, k ≤ 3 sont rela7vement compliquées.
• Une tronca7on simple risque de causer des erreurs importants suite au déclin lent de l’interac7on et demande des rayons r
c∝ L très importants entrainant N ∝ L
3∝ r
c3par7cules dans la boite de simula7on.
Les interac7ons sont effec7vement tronquées
aux limites de la boite.
• Somma)on d’Ewald
• Les condi7ons périodiques donnent une superstructure périodique qui permet une adapta7on des méthodes de la cristallographie
(Madelung 1918, Ewald 1921) pour la somma7on des interac7ons sur un espace infini et périodique.
• L’interac7on est repar7e comme une somme sur une par7e de courte portée Vc et une par7e de longue portée Vl
V (r) = Vc(r) + Vl(r)
• La somma7on sur Vc est effectuée en espace réel et la somma7on sur Vl dans l’espace réciproque.
• PPPM est un acronym pour Par)cle-Par)cle, Par)cle-Mesh
• La méthode repose également sur une répar77on en interac7on courte Vc et interac7on longue Vl.
• L’interac7on courte est traitée par somma7on explicite (par7cle- par7cle) et l’interac7on de longue portée est traitée comme
interac7on de chaque par7cule avec le champ moyen des par7cules restantes par résolu7on de l’ équa7on de Poisson.
14
4. Mise en place d’une simula0on de Dynamique Moléculaire
Une fois le modèle énergé7que choisi, la simula7on elle même peut être décomposée en 4 par7es:
i) Etablissement de la configura)on ini)ale Règles générales:
• configura7on proche de l’état que l’on souhaite simuler
• sans mauvais contacts → minimisa7on u7le
o Systèmes homogènes (grand nb de molécules iden7ques)
o Systèmes hétérogènes (soluté+solvant) Structure en réseau standard
- Expérimentale
- Réseau cristallin courant (ex: CFC)
Soluté: - structure expérimentale (RMN, Rayons-X, …) - structure modélisée
(prédic7on, par homologie, MC, …) Solvant - quelques molécules d’après rayons X
+ molécules issues de DM ou MC
15
Le système évolue librement.
Obten7on de la trajectoire ii) Chauffage + équilibrage
Chauffage
Si configura7on ini7ale = résultat d’une minimisa7on → état à ~ 0 K
Simula7on réalisée à T (typiquement T=300K) apport progressif d’énergie ciné7que selon une distribu7on de Boltzmann des vitesses
T Nk v
m
E N i i B
i
cin 2
3 2
1 2
1
=
= ∑
Équilibrage =
Le système évolue.
Certaines propriétés structurales et thermodynamiques sont suivies et éventuellement réajustées jusqu’à stabilisa7on
iii) Produc)on
iv) Analyse des résultats
16
8.Analyse d’une trajectoire
a) moyennes temporelles
7
25
Exemple de mise au point d’une simulation de protéine
Mise au point du sytème
Structure de départ
Choix champ de force, mini initiale
Génération de la boîte de solvant Mini protéine + solvant
Ajout de contre-ions si nécessaire Mini solvant + ions +
protéine
Phase d’équilibrage
Blocage de la protéine avec des "position restraints"
(éventuellement relâchement lent)
Phase de production
Enregistrement positions, énergies, vitesses en fonction du temps
Analyse
Propriétés d’intérêt convergées?
Si non, étendre la production
Phase de chauffage
Instantané ou progressif
PF 02/2010
26
PLAN
1. Gestion des bords
2. Algorithme de Dynamique Moléculaire 3. Protocole de Dynamique Moléculaire 4. Analyse de trajectoire
PF 02/2010
27
Séries temporelles
• Soit A une grandeur d’intérêt (e.g. une énergie, une distance…)
• Les variables dépendent des coordonnées et/ou des vitesses : A(t) = f(r1(t),…,rN(t),v1(t),…,vN(t))
• Séries temporelles : variable dynamique le long de la trajectoire
A(t): f(0) f(1) f(2) …f(nsteps)
t: t=0 t=1 t=2 …t=nsteps
• Moyenne :
• Fluctuations :
∑
==
nsteps
t
t nsteps A
A
1
) 1 (
( )
∑
=−
=
nsteps
t
A A t A
nsteps 1
) 2
1 ( σ
PF 02/2010
28
Analyses de base (obligatoires!)
• Visualisation de la trajectoire (mouvements mis en jeu)
– ngmx (outil GROMACS) : simple, peu flexible (pas très beau !) – VMD (http://www.ks.uiuc.edu/Research/vmd/) : plus poussé,
meilleur graphisme, sans doute le plus adapté (lecture de trajectoire GROMACS, CHARMM, AMBER…), (plus joli !)
• Analyse des énergies du système
– Énergie potentielle (décomposition en ses différents termes) – Énergies cinétique et totale (Etot=Epot+Ekin)
– Température, Pression (Volume / Densité) selon l’ensemble thermodynamique
• Ces valeurs ont-elles convergées (fluctuations autour d’une valeur moyenne)?
– Oui ! on peut continuer l’analyse
– Non ! la ligne de base diverge : tenter d’en comprendre la raison (continuer la simulation ou l’abandonner et changer le protocole)
PF 02/2010
σ fluctua7on ou écart-type
17
b) L’analyse de base:
1. Visualisa7on de la trajectoire (mouvements des atomes): VMD 2. Analyse des énergies du système:
• Energie poten7elle
• Energie ciné7que
• Energie totale
• Températures, Pression, Volume, Densité (suivant l’ensemble thermodynamique)
3. Les valeurs ont-elles convergées ? (fluctua7ons autours d’une valeur moyenne ?
• Oui : on peut con7nuer l’analyse
• NON: la ligne de base diverge alors comprendre pourquoi et
augmenter le temps de dynamique ou bien changer de protocole.
Energie
Energie poten7elle :
où uiext est un poten7el d’interac7on externe (champs de gravité, milieu poreux moyenné…), uij correspond aux interac7ons à deux corps entre une par7cule i et une par7cule j.
Energie ciné7que :
Si l'ensemble du système ne subit pas de dérive spa7ale (quan7té de mouvement nulle) et n’est soumis à aucun champ extérieur (uext=0) l’énergie totale est du point de vue thermodynamique égale à l’énergie interne du fluide étudié (à une constante près) :
18
Dans l’ensemble microcanonique (NVE), pour s’assurer de la qualité d’une simula7on, il est nécessaire de vérifier qu’il y a conserva)on de l’énergie totale durant la phase de produc7on:
Les fluctua7ons observées ne doivent pas excéder qq %
D ’après Molecular Modeling. A. Leach
Total energy
19
Unité des énergies en kcal/mol
EKCLT: energie ciné7que du centre de masse en transla7on
Ecart quadra)que moyen (Root Mean Square Devia)on, RMSd) : basée sur les coord ou sur les distances
• Soit les structures A et B.
• Ai une coordonnée dans la structure A.
• T une transforma7on (transla7on, rota7on)
dAij est la distance entre l’atome i et l’atome j dans A.
t RMSd
2-3 0
OK
21
1) Alignement 2) Calcul de RMSd
Rayon de gyra7on:
10
37
Rayon de giration
• Décrit la compacité d’une molécule
• Position du centre de masse
∑
==
N
i
mi
M
1
∑
=−
=
N
i
CM
i
r
N r Rgyr
1
1 r r
2 N = nombre d’atomesvecteur ri = position de l’atome i
∑
==
N
i
i i
CM
m r
r M
1
1 r
r
N= nombre d’atomes mi = masse de l’atome i
vecteur ri = position de l’atome i M = masse de la molécule
PF 02/2010
38
Fluctuations atomiques
• Positions atomiques moyennes
• Fluctuations atomiques (Root Mean Square Fluctuations)
∑
=−
=
nsteps
t
i i
i r t r
nsteps RMSF
1
) 2
1 r( r
∑
==
nsteps
t
i
i
r t
nsteps r
1
)
1 r (
r
8 2
3 π
i i
RMSF = B
(avec nsteps = temps total de simulation)
(avec Bi = facteur B de cristallographie)
PF 02/2010
39
Distribution radiale
• Définit la position des particules les unes par
rapport aux autres (mesurable par diffraction de neutrons ou de rayons X)
ρ ρ ( ) )
( r
r
g =
r
g(r)
densité moyenne du fluide
densité moyenne à une distance r d’une particule donnée
1ère couche
2ème couche
tend vers 1.0
http://www.physchem.ox.ac.uk/~rkt/lectures/liqsolns/liquids.html
PF 02/2010
40
Angles dièdres φ/ψ et carte de Ramachandran (angles χ)
PF 02/2010 22
Fluctua7ons atomiques
10
37
Rayon de giration
• Décrit la compacité d’une molécule
• Position du centre de masse
∑
==
N
i
mi
M
1
∑
=−
=
N
i
CM i
r N r
Rgyr
1
1 r r
2 N= nombre d’atomesvecteur ri = position de l’atome i
∑
==
N
i
i i
CM
m r
r M
1
1 r
r
N = nombre d’atomes mi = masse de l’atome i
vecteur ri = position de l’atome i M = masse de la molécule
PF 02/2010
38
Fluctuations atomiques
• Positions atomiques moyennes
• Fluctuations atomiques (Root Mean Square Fluctuations)
∑
=−
=
nsteps
t
i i
i r t r
nsteps RMSF
1
) 2
1 r( r
∑
==
nsteps
t
i
i
r t
nsteps r
1
)
1 r (
r
8 2
3 π
i i
RMSF = B
(avec nsteps = temps total de simulation)
(avec Bi = facteur B de cristallographie)
PF 02/2010
39
Distribution radiale
• Définit la position des particules les unes par
rapport aux autres (mesurable par diffraction de neutrons ou de rayons X)
ρ ρ ( ) )
( r
r
g =
r
g(r)
densité moyenne du fluide
densité moyenne à une distance r d’une particule donnée
1ère couche
2ème couche
tend vers 1.0
http://www.physchem.ox.ac.uk/~rkt/lectures/liqsolns/liquids.html
PF 02/2010
40
Angles dièdres φ/ψ et carte de Ramachandran (angles χ)
PF 02/2010
23
Distribu7on radiale
10
37
Rayon de giration
• Décrit la compacité d’une molécule
• Position du centre de masse
∑
==
N
i
mi
M
1
∑
=−
=
N
i
CM i
r N r
Rgyr
1
1 r r
2 N = nombre d’atomesvecteur ri = position de l’atome i
∑
==
N
i
i i
CM
m r
r M
1
1 r
r
N = nombre d’atomes mi = masse de l’atome i
vecteur ri = position de l’atome i M = masse de la molécule
PF 02/2010
38
Fluctuations atomiques
• Positions atomiques moyennes
• Fluctuations atomiques (Root Mean Square Fluctuations)
∑
=−
=
nsteps
t
i i
i r t r
nsteps RMSF
1
) 2
1 r( r
∑
==
nsteps
t
i
i
r t
nsteps r
1
)
1 r (
r
8 2
3 π
i i
RMSF = B
(avec nsteps = temps total de simulation)
(avec Bi = facteur B de cristallographie)
PF 02/2010
39
Distribution radiale
• Définit la position des particules les unes par
rapport aux autres (mesurable par diffraction de neutrons ou de rayons X)
ρ ρ ( ) )
( r
r
g =
r
g(r)
densité moyenne du fluide
densité moyenne à une distance r d’une particule donnée
1ère couche
2ème couche
tend vers 1.0
http://www.physchem.ox.ac.uk/~rkt/lectures/liqsolns/liquids.html
PF 02/2010
40
Angles dièdres φ/ψ et carte de Ramachandran (angles χ)
PF 02/2010 24
Grandeurs sta7s7ques
Autocorréla7on des vitesses
Diffusion
Informa7ons structurales : carte de Ramachandran
Résidu i i+1 i-1
χ
29
Sta7s7que
30