Modélisa)on Mul)-échelle: Modélisa)on des Macromolécules biologiques Séance 5 (1H30)

(1)

1

Modélisa)on Mul)-échelle:

Modélisa)on des Macromolécules biologiques Séance 5 (1H30)

Cours de Master M2 Isabelle Navizet

Isabelle.navizet@u-pem.fr

Laboratoire Modélisa7on et Simula7on Mul7-Echelle (MSME)

(2)

2

Résumé des cours 1, 2, 3 et 4

•  Modélisa7on: Mo7va7on

•  Visualisa7on des protéines (VMD TP1)

•  Champs de forces

•  Protona7on des protéines (H++ et VMD TP2)

•  Algorithmes de minimisa7on

•  Algor7hmes de dynamique moléculaire (MD)

•  Mise en place d’une MD: 1.traitement du solvant

•  Prépara7on d’une MD (leap TP3)

(3)

3

Condi&ons périodiques aux limites

2. Condi)ons aux limites

Pas de condi7on aux limites (=vide ou solvant implicite) tend à compacter le système Modèle de taille limitée:

nécessité de préciser les condi7ons aux limites pour reproduire au mieux le système réel

Simula7on d’un système inﬁni par réplica7on du système dans toutes les direc7ons

On calcule alors les interac7ons seulement entre les atomes de la cellule centrale et ses voisines immédiates

- Une des meilleures méthodes disponibles

- Très coûteuses pour des systèmes de grande taille

(4)

source h\p://realwireless.wordpress.com/2008/06/03/hexagons-in-3d-is-it- 7me-to-update- the-deﬁning-image-of-the-cellular-industry/

2

5

Gestion des bords : vide

• Pas de solvant : interface avec le vide !

• Problèmes:

– Simulations non réalistes

– La tension de surface tendra à rendre le système plus compacte (sphérique) afin de diminuer la surface moléculaire

• Déformations de molécules non sphériques e.g. ADN – Pas d’écrantage des charges par le solvant

• Solutions possibles

– Modèle de solvant implicite (e.g. constante diélectrique dépendante de la distance)

– Ajout de forces stochastiques pour mimer le solvant sur les atomes de surface

– Simuler explicitement les molécules de solvant (solvant explicite)

PF 02/2010

6

• La boîte de simulation est répliquée dans toutes les directions de l’espace

• Les particules quittant la boîte centrale sont

réintroduites du côté opposé

• Les interactions sont calculées avec les particules des cellules voisines

Conditions périodiques aux limites

PF 02/2010

7

Formes de boîte

PF 02/2010

Formes de boîte (2)

PF 02/2010

8

Truncated octahedron

Rhombic dodecahedron

source http://realwireless.wordpress.com/2008/06/03/hexagons-in-3d-is-it-time-to-update- the-defining-image-of-the-cellular-industry/

cubique

Forme des boites d’eau pour les simula7ons de protéines

4

(5)

5

3. Traitement des interactions non liées : cut-off

Termes liés ∝ N

Termes non liés ∝ N² partie la plus coûteuse d’une simulation

Les interactions électrostatiques et de vdW décroissent avec la distance interatomique r_ij on les néglige pour r_ij > cut-off

Approximation - valable pour vdW (décroît en 1/r⁶)

- moins valable pour elec (décroît en 1/r)

Cut-off ~ 10 Å

Avec les conditions périodiques aux limites, le cut-off doit être tel que chaque particule ne puisse pas voir sa propre image

cut-off < (plus petite longueur de boîte)/2

(6)

Interac7ons intramoléculaires

•  La modélisa7on des interac7ons intramoléculaire consiste aux élonga7ons de liaisons (2 par7cules impliquées, au maximum 4 ou rarement 6 atomes liées chimiquement à un atome donné ⇒ ≤ 6 interac7ons par atome), et aux angles impliquant 2 ou trois autres atomes à proximité.

•  Chaque atome intervient dans le calcul de l’ordre de 10-20 interac7ons intramoléculaires, l’eﬀort total pour les interac7ons intramoléculiaire tcalc,inter ∝ N.

Le réseau de liaisons ne change pas pendant la simula7on ⇒ les voisins de chaque par7cule sont connus et leurs indices peuvent être stockés dans une liste de voisins établie une fois au début du calcul.

(7)

Interac7ons non-liantes

•  Le calcul de la contribu7on des interac7ons non-liantes entre et dans les molécules consomme la plus grande par7e de l’eﬀort de calcul des forces tcalc,inter >> t_calc,intra.

•  Pour un poten7el d’interac7on de portée limitée (V(r) ∝ r^−k,k > 3) il est jus7ﬁable de se limiter aux interac7ons avec les N_v par7cules qui sont dans une sphère de rayon r_c autour de la par7cule i.

•  Le rayon r_c doit être pris suﬃsamment grand pour minimiser la diﬀérence par rapport à un calcul complet de la force.

•  Pour l’interac7on Lennard-Jones le rayon de tronca7on r_c est typiquement pris entre 8-10 Å.

(8)

Troncature et switch

(9)

Liste de voisins

•  On peut exploiter une tronca7on de l’interac7on en calculant l’ensemble des distances pour ensuite évaluer seulement les interac7ons entre paires de par7cules suﬃsamment proches.

•  On gagne du temps dans l’ évalua7on du poten7el d’interac7on mais on doit toujours calculer les N (N − 1)/2 distances r_ij.

•  La technique de tronca7on devient vraiment intéressante si on arrive à éliminer l’eﬀort ∝ N² du calcul des distances (au moins par7ellement).

•  Une technique introduite par L. Verlet est la construc7on d’une liste de voisins.

Un calcul de l’ensemble des distances est u7lisé pour compiler des listes d’autres par7cules qui sont dans le rayon r_c autour d’une par7cule i (eﬀort ∝ N²).

Dans un système peu mobile (crystal) ce\e liste peut rester valable pendant toute la simula7on.

Dans un liquide le mouvement des par7cules demande des mises à jour de la liste (par7cules entrant ou sortant de la sphère d’interac7on). Chaque version de la liste est u7lisée pendant plusieurs pas de dynamique.

(10)

•  Pour éviter la reconstruc7on de la liste à chaque pas on construit la liste en incluant une couche supplémentaire (’skin’) de rayon r

_l

.

•  La reconstruc7on de la liste est déclenchée par

un compteur qui accumule les déplacements des

par7cules (eﬀort ∝ N). Dans la pra7que cela

conduit à des intervalles d’environ 10 pas

d’intégra7on.

(11)

•  A des densités liquides typiques chaque par7cule a environ 75 voisins. Chaque voisin entre dans deux interac7ons de paires et il suﬃt de stocker de l’ordre de 40 voisins par par7cule en moyenne et alors prévoir un espace de stockage total de l’ordre de 40N en7ers.

•  La technique des listes est diﬃcile à vectoriser et à paralléliser.

(12)

Interac7ons de longue portée

•  Les techniques pour le traitement correct les interac7ons de longue portée V (r) ∝ r

^−k

, k ≤ 3 sont rela7vement compliquées.

•  Une tronca7on simple risque de causer des erreurs importants suite au déclin lent de l’interac7on et demande des rayons r

_c

∝ L très importants entrainant N ∝ L

³

∝ r

_c³

par7cules dans la boite de simula7on.

Les interac7ons sont eﬀec7vement tronquées

aux limites de la boite.

(13)

•  Somma)on d’Ewald

•  Les condi7ons périodiques donnent une superstructure périodique qui permet une adapta7on des méthodes de la cristallographie

(Madelung 1918, Ewald 1921) pour la somma7on des interac7ons sur un espace inﬁni et périodique.

•  L’interac7on est repar7e comme une somme sur une par7e de courte portée V_cet une par7e de longue portée V_l

V (r) = V_c(r) + V_l(r)

•  La somma7on sur V_c est eﬀectuée en espace réel et la somma7on sur V_ldans l’espace réciproque.

•  PPPM est un acronym pour Par)cle-Par)cle, Par)cle-Mesh

•  La méthode repose également sur une répar77on en interac7on courte V_c et interac7on longue V_l.

•  L’interac7on courte est traitée par somma7on explicite (par7cle- par7cle) et l’interac7on de longue portée est traitée comme

interac7on de chaque par7cule avec le champ moyen des par7cules restantes par résolu7on de l’ équa7on de Poisson.

(14)

14

4. Mise en place d’une simula0on de Dynamique Moléculaire

Une fois le modèle énergé7que choisi, la simula7on elle même peut être décomposée en 4 par7es:

i)  Etablissement de la conﬁgura)on ini)ale Règles générales:

•  conﬁgura7on proche de l’état que l’on souhaite simuler

•  sans mauvais contacts → minimisa7on u7le

o  Systèmes homogènes (grand nb de molécules iden7ques)

o  Systèmes hétérogènes (soluté+solvant) Structure en réseau standard

- Expérimentale

- Réseau cristallin courant (ex: CFC)

Soluté: - structure expérimentale (RMN, Rayons-X, …) - structure modélisée

(prédic7on, par homologie, MC, …) Solvant - quelques molécules d’après rayons X

+ molécules issues de DM ou MC

(15)

15

Le système évolue librement.

Obten7on de la trajectoire ii) Chauﬀage + équilibrage

Chauﬀage

Si conﬁgura7on ini7ale = résultat d’une minimisa7on → état à ~ 0 K

Simula7on réalisée à T (typiquement T=300K) apport progressif d’énergie ciné7que selon une distribu7on de Boltzmann des vitesses

T Nk v

m

E ^N _i _i _B

i

cin 2

3 2

1 ₂

1

=

= ∑

Équilibrage =

Le système évolue.

Certaines propriétés structurales et thermodynamiques sont suivies et éventuellement réajustées jusqu’à stabilisa7on

iii) Produc)on

iv) Analyse des résultats

(16)

16

8.Analyse d’une trajectoire

a) moyennes temporelles

7

25

Exemple de mise au point d’une simulation de protéine

Mise au point du sytème

Structure de départ

Choix champ de force, mini initiale

Génération de la boîte de solvant Mini protéine + solvant

Ajout de contre-ions si nécessaire Mini solvant + ions +

protéine

Phase d’équilibrage

Blocage de la protéine avec des "position restraints"

(éventuellement relâchement lent)

Phase de production

Enregistrement positions, énergies, vitesses en fonction du temps

Analyse

Propriétés d’intérêt convergées?

Si non, étendre la production

Phase de chauffage

Instantané ou progressif

PF 02/2010

26

PLAN

1. Gestion des bords

2. Algorithme de Dynamique Moléculaire 3. Protocole de Dynamique Moléculaire 4. Analyse de trajectoire

PF 02/2010

27

Séries temporelles

• Soit A une grandeur d’intérêt (e.g. une énergie, une distance…)

• Les variables dépendent des coordonnées et/ou des vitesses : A(t) = f(r₁(t),…,r_N(t),v₁(t),…,v_N(t))

• Séries temporelles : variable dynamique le long de la trajectoire

A(t): f(0) f(1) f(2) …f(nsteps)

t: t=0 t=1 t=2 …t=nsteps

• Moyenne :

• Fluctuations :

∑

=

nsteps

t

t nsteps A

A

1

) 1 (

( )

∑

=

−

=

nsteps

t

A A t A

nsteps ₁

) 2

1 ( σ

PF 02/2010

28

Analyses de base (obligatoires!)

• Visualisation de la trajectoire (mouvements mis en jeu)

– ngmx (outil GROMACS) : simple, peu flexible (pas très beau !) – VMD (http://www.ks.uiuc.edu/Research/vmd/) : plus poussé,

meilleur graphisme, sans doute le plus adapté (lecture de trajectoire GROMACS, CHARMM, AMBER…), (plus joli !)

• Analyse des énergies du système

– Énergie potentielle (décomposition en ses différents termes) – Énergies cinétique et totale (E_tot=E_pot+E_kin)

– Température, Pression (Volume / Densité) selon l’ensemble thermodynamique

• Ces valeurs ont-elles convergées (fluctuations autour d’une valeur moyenne)?

– Oui ! on peut continuer l’analyse

– Non ! la ligne de base diverge : tenter d’en comprendre la raison (continuer la simulation ou l’abandonner et changer le protocole)

PF 02/2010

σ ﬂuctua7on ou écart-type

(17)

17

b) L’analyse de base:

1.  Visualisa7on de la trajectoire (mouvements des atomes): VMD 2.  Analyse des énergies du système:

•  Energie poten7elle

•  Energie ciné7que

•  Energie totale

•  Températures, Pression, Volume, Densité (suivant l’ensemble thermodynamique)

3.  Les valeurs ont-elles convergées ? (ﬂuctua7ons autours d’une valeur moyenne ?

•  Oui : on peut con7nuer l’analyse

•  NON: la ligne de base diverge alors comprendre pourquoi et

augmenter le temps de dynamique ou bien changer de protocole.

(18)

Energie

Energie poten7elle :

où u_i^ext est un poten7el d’interac7on externe (champs de gravité, milieu poreux moyenné…), u_ijcorrespond aux interac7ons à deux corps entre une par7cule i et une par7cule j.

Energie ciné7que :

Si l'ensemble du système ne subit pas de dérive spa7ale (quan7té de mouvement nulle) et n’est soumis à aucun champ extérieur (u_ext=0) l’énergie totale est du point de vue thermodynamique égale à l’énergie interne du ﬂuide étudié (à une constante près) :

18

(19)

Dans l’ensemble microcanonique (NVE), pour s’assurer de la qualité d’une simula7on, il est nécessaire de vériﬁer qu’il y a conserva)on de l’énergie totale durant la phase de produc7on:

Les ﬂuctua7ons observées ne doivent pas excéder qq %

D ’après Molecular Modeling. A. Leach

Total energy

19

(20)

Unité des énergies en kcal/mol

EKCLT: energie ciné7que du centre de masse en transla7on

(21)

Ecart quadra)que moyen (Root Mean Square Devia)on, RMSd) : basée sur les coord ou sur les distances

•  Soit les structures A et B.

•  A_iune coordonnée dans la structure A.

•  T une transforma7on (transla7on, rota7on)

d^A_ij est la distance entre l’atome i et l’atome j dans A.

t RMSd

2-3 0

OK

21

1)  Alignement 2)  Calcul de RMSd

(22)

Rayon de gyra7on:

10

37

Rayon de giration

• Décrit la compacité d’une molécule

• Position du centre de masse

∑

=

N

i

mi

M

1

∑

=

−

=

N

i

CM

i

r

N r Rgyr

1

1 r r

2 ^N = nombre d’atomes

vecteur r_i = position de l’atome i

∑

=

N

i

i i

CM

m r

r M

1

1 r

r

N= nombre d’atomes m_i = masse de l’atome i

vecteur r_i = position de l’atome i M = masse de la molécule

PF 02/2010

38

Fluctuations atomiques

• Positions atomiques moyennes

• Fluctuations atomiques (Root Mean Square Fluctuations)

∑

=

−

=

nsteps

t

i i

i r t r

nsteps RMSF

1

) 2

1 r( r

∑

=

nsteps

t

i

r t

nsteps r

1

)

1 r (

r

8 2

3 π

i i

RMSF = B

(avec nsteps = temps total de simulation)

(avec B_i = facteur B de cristallographie)

PF 02/2010

39

Distribution radiale

• Définit la position des particules les unes par

rapport aux autres (mesurable par diffraction de neutrons ou de rayons X)

ρ ρ ( ) )

( r

r

g =

r

g(r)

densité moyenne du fluide

densité moyenne à une distance r d’une particule donnée

1^ère couche

2^ème couche

tend vers 1.0

http://www.physchem.ox.ac.uk/~rkt/lectures/liqsolns/liquids.html

PF 02/2010

40

Angles dièdres φ/ψ et carte de Ramachandran (angles χ)

PF 02/2010 22

(23)

Fluctua7ons atomiques

10

37

Rayon de giration

∑

=

N

i

mi

M

1

∑

=

−

=

N

i

CM i

r N r

Rgyr

1

1 r r

2 ^N= nombre d’atomes

∑

=

N

i

i i

CM

m r

r M

1

1 r

r

N = nombre d’atomes m_i = masse de l’atome i

PF 02/2010

38

Fluctuations atomiques

∑

=

−

=

nsteps

t

i i

i r t r

nsteps RMSF

1

) 2

1 r( r

∑

=

nsteps

t

i

r t

nsteps r

1

)

1 r (

r

8 2

3 π

i i

RMSF = B

PF 02/2010

39

Distribution radiale

ρ ρ ( ) )

( r

r

g =

r

g(r)

1^ère couche

2^ème couche

tend vers 1.0

PF 02/2010

40

Angles dièdres φ/ψ et carte de Ramachandran (angles χ)

PF 02/2010

23

(24)

Distribu7on radiale

10

37

Rayon de giration

∑

=

N

i

mi

M

1

∑

=

−

=

N

i

CM i

r N r

Rgyr

1

1 r r

2 ^N = nombre d’atomes

∑

=

N

i

i i

CM

m r

r M

1

1 r

r

N = nombre d’atomes m_i = masse de l’atome i

PF 02/2010

38

Fluctuations atomiques

∑

=

−

=

nsteps

t

i i

i r t r

nsteps RMSF

1

) 2

1 r( r

∑

=

nsteps

t

i

r t

nsteps r

1

)

1 r (

r

8 2

3 π

i i

RMSF = B

PF 02/2010

39

Distribution radiale

ρ ρ ( ) )

( r

r

g =

r

g(r)

1^ère couche

2^ème couche

tend vers 1.0

PF 02/2010

40

Angles dièdres φ/ψ et carte de Ramachandran (angles χ)

PF 02/2010 24

(25)

Grandeurs sta7s7ques

(26)

(27)

Autocorréla7on des vitesses

(28)

Diﬀusion

(29)

Informa7ons structurales : carte de Ramachandran

Résidu i i+1 i-1

χ

29

(30)

Sta7s7que

30

(31)

Modélisa)on Mul)-échelle: Modélisa)on des Macromolécules biologiques Séance 5 (1H30)

Résumé des cours 1, 2, 3 et 4

Interac7ons intramoléculaires

Interac7ons non-liantes

Liste de voisins

• Pour éviter la reconstruc7on de la liste à chaque pas on construit la liste en incluant une couche supplémentaire (’skin’) de rayon r

.

• La reconstruc7on de la liste est déclenchée par

un compteur qui accumule les déplacements des

par7cules (eﬀort ∝ N). Dans la pra7que cela

conduit à des intervalles d’environ 10 pas

d’intégra7on.

Interac7ons de longue portée

• Les techniques pour le traitement correct les interac7ons de longue portée V (r) ∝ r

, k ≤ 3 sont rela7vement compliquées.

• Une tronca7on simple risque de causer des erreurs importants suite au déclin lent de l’interac7on et demande des rayons r

∝ L très importants entrainant N ∝ L

∝ r

par7cules dans la boite de simula7on.

Les interac7ons sont eﬀec7vement tronquées

aux limites de la boite.

Exemple de mise au point d’une simulation de protéine

PLAN

Séries temporelles

∑

( )

∑

Analyses de base (obligatoires!)

10

Rayon de giration

∑

∑

−

=

r

N r Rgyr

1 r r

∑

=

m r

r M

1 r

r

Fluctuations atomiques

∑

∑

=

r t

nsteps r

)

1 r (

r

Distribution radiale

ρ ρ ( ) )

( r

r

g =

Angles dièdres φ/ψ et carte de Ramachandran (angles χ)

10

Rayon de giration

∑

∑

−

=

r N r

Rgyr

1 r r

∑

=

m r

r M

1 r

r

Fluctuations atomiques

∑

∑

=

r t

nsteps r

)

•  Pour éviter la reconstruc7on de la liste à chaque pas on construit la liste en incluant une couche supplémentaire (’skin’) de rayon r

•  La reconstruc7on de la liste est déclenchée par

•  Les techniques pour le traitement correct les interac7ons de longue portée V (r) ∝ r

•  Une tronca7on simple risque de causer des erreurs importants suite au déclin lent de l’interac7on et demande des rayons r

•  h\p://ambermd.org/tutorials/analysis/