1
Modélisation Multi-échelle:
Modélisation des Macromolécules biologiques Séance 2 (1H30)
Cours de Master M2 Isabelle Navizet
Isabelle.navizet@u-pem.fr
Laboratoire Modélisation et Simulation Multi-Echelle (MSME)
Résumé du cours 1:
La Modélisation Moléculaire : Pourquoi ?
• Déterminer la configuration atomique d’un système.
• Évaluer des propriétés physico-chimiques du système étudié.
• Pour les protéines: interactions avec des ligands
(médicaments, polluants, poisons, chromophores…)
• Prédiction
• Visualisation des protéines (VMD TP1)
3
Phase condensée réelle Modèle
Résultats expérimentaux
Propriétés calculées
Prédictions théoriques
Expériences Simulations
numériques
Théories: solutions analytiques
Analyse de spectres complexes
Comparaison Comparaison Ajustement des potentiels
d’interaction Test des modèles Affinement des théories
Modélisation
• Description microscopique des molécules en phase condensée
• Calculs de propriétés inaccessibles par l’expérience
• Simulation d’expériences et de réactions chimiques et biologiques
• Visualisation des structures et de leur dynamique
Les différentes étapes des études de Modélisation
Moléculaire
• Le choix du système de coordonnées
• Le choix de la description des interactions
• Le choix de la méthode de calcul
• L’analyse des résultats
5
Le système de coordonnées
• Coordonnées cartésiennes : x, y, z
• Coordonnées internes : longueurs des liaisons, angles de valence et angles de torsion.
• Réseau granulaire : carbones α
Résidu i i+1 i-1
χ
Descriptions des interactions
• Mécanique Quantique (résolution de l’équation de Schrödinger)
- Traite les électrons d’un système: résolution de l’équation de Schrödinger
- Limitée à des systèmes comportant un faible nombre d’atomes
• Mécanique Moléculaire (méthode à champ de forces), méthode dite
« classique »
- Détermination de la fonction d’énergie potentielle ou champ de forces qui décrit les interactions atomiques inter- et
intramoléculaires
7
Mécanique moléculaire
- Ignore le mouvement des électrons
- Calcule l’énergie d’un système comme une fonction des positions des noyaux uniquement.
- Ne peut pas casser ou créer de liaisons covalentes
- Dédiée aux systèmes comportant un grand nombre d’atomes
- Basée sur une fonction d’énergie potentielle empirique (ou champ de force)
- Basée sur
- L’approximation de Born-Oppenheimer (adaptation instantanée des e- aux mouvements des noyaux)
- Modèles d’interactions simples
Energie potentielle d’interaction:
• De façon générale, l’énergie potentielle d’interaction total de N particules :
• r représente la position de la particule i,
• u1 représente l’énergie potentielle due à un champ extérieur au système de particules, comme la gravité, un champ électrique …,
• u2 correspond aux interactions d’une paire de particules
• u3 représente les interactions d’un triplet de particules et ainsi de suite.
⇒ approximation à 2 corps : énergie potentielle effective
les forces dérivent de l’énergie potentielle Ui,
!
!
Energies potentielles polyatomiques
• Termes d’énergie liée : liaison entre les atomes
• Termes d’énergie non liée : pas de liaison entre les atomes
9
Molécules rigides
• Si petite molécule : structure considérée comme rigide
• Exemple de l’eau: TIP3P, TIP4P:
3 points pour TIP3P (1 oxygène et 2 atomes d’hydrogène)
4 points pour TIP4P (1 O, 2 H et un point M fictif sur la médiane entre les deux H)
• Pour TIP3P, la charge partielle négative localisée sur O est contrebalancée par les charges partielles positives localisées sur les H.
• Pour TIP4P, la charge localisée sur M est contrebalancée par les charges localisées sur les H.
• Les interactions de van der Waals entre deux molécules d’eau sont calculées comme des interactions de Lennard-Jones (cf interaction intermoléculaires) entre les oxygène. Aucune interaction de van der Waals n’est prise en compte faisant intervenir les H.
(https://fr.wikipedia.org/wiki/Modèle_d'eau)
Champs de force pour l’eau
h1p://www1.lsbu.ac.uk/water/water_models.html An example: TIP3P model
kC, the electrostaCc constant: 332.1 Å·kcal/mol qi are the parCal charges
rij is the distance between two atoms or charged sites;
A and B are the Lennard-Jones parameters.
The lenght O-H and angle HOH are fixed.
Different models:
The charged sites may be on the atoms or on dummy sites (such as lone pairs). In most water models, the Lennard-Jones term applies only to the interacCon between the oxygen atoms
Molécule flexible
• L’énergie intramoléculaire d’une molécule flexible provient de quatre termes :
-l’énergie de liaison (élongation) -l’énergie due à l’angle de pliage
-l’énergie due à l’angle dièdre (entre deux plans)
-l’énergie de longue portée entre atomes voisins (potentiel effectif de type Lennard-Jones ).
• Ainsi, lorsque l’on s’attache à décrire des molécules
articulées il est important d’intégrer ces degrés de liberté interne représentés par l’élongation, la flexion et la torsion.
1) L’élongation
!
13
!
2) Le pliage U
θ= ½ k
θ( θ - θ
o)
2!
3) La torsion
!
15
!
Uϕ = Vn,ϕ
2 [1+cos(nϕ +γ)]
n=0 N
∑
• Vn donne une idée sur la hauteur de la barrière (il manque les termes non liés 1,4 qui contribuent aussi à la hauteur de la barrière).
• n est la multiplicitée : il donne le nombre de minima de la fonction entre 0 et 2π.
• γ est le facteur de phase : il donne la valeur de φ pour laquelle la fonction est maximale.
Energie de torsion
• Ethane CH3-CH3 n=3, γ=0°,
• VHCCH= V (1+cos(3φ))
Ethylène CH2=CH2 n=2, γ=180°, VHCCH= V (1+cos(2φ-180))
• CH2X-CH2X VXCCX= V1+V2+V3
Torsion impropre
• Parfois, il est également nécessaire d’introduire un autre potentiel lié à la
torsion dite impropre (mouvement d’un atome dans un plan formé par trois
autres).
17
!
0 2 12 w(w- w )
= k Eimpropres
4) Potentiel longue porté
L’énergie de longue portée est introduite en utilisant un potentiel effectif (de type Lennard-Jones par exemple) entre
atomes séparés par plus de trois liaisons
Potentiel intermoléculaire
• Forces répulsives :
forces répulsives dues au recouvrement des nuages électronique, dont l’énergie potentielle décroît en r-1à courte distance et exponentiellement à plus grande distance exp(-2r/a0). On l’appelle aussi interaction stérique.
• Forces attractives :
On les décompose souvent en trois termes, qui des plus fortes aux plus faibles sont : les interactions ioniques (200-500 kJ/mol) (en r-1),
les liaisons hydrogène (»20 kJ/mol) et les forces de van der Waals (0.5-3 kJ/mol):
-les forces de dispersion (ou forces de London) attractives (interactions dipôle induit - dipôle induit). Le potentiel associé est en r-6.
-les forces d’induction (forces de Debye) (interactions dipôle – dipôle induit). Le potentiel correspondant est en r-6.
-les forces dipolaires (forces de Keesom) (interactions dipôle – dipôle). Le potentiel, directionnel, associé est en en r-3, et se ramène à un potentiel en en r-6 lorsque les molécules sont en rotation rapide (non directionnel).
19
Modélisation des interactions non polaires:
Potentiel sphère dure (à gauche) et potentiel sphère molle (à droite) pour α=12.
Potentiel carré (à gauche) ou σ 2=1,5σ1 et potentiel de Lennard-Jones 12-6 (à droite).
les valeurs attribuées la majorité du temps aux paramètres sont fonctions de l’état thermodynamique et de la propriété que l’on veut simuler.
Simple troncature
Troncature
et déplacement Problème à longue portée
Troncature et switch
Interactions électrostatiques
!
où les q sont les charges sur les sites i et j et ε0 est la permittivité du vide.
Calculs pour les longues portées car décroissance en r -1 : sommation d’Ewald
Remarques:
Des facteurs correcteurs dans les interactions LJ et électrostatique sont pris en compte pour les
interactions de type 1-4 (j=i+ 3, 3 liaisons entre i et j) pour compenser le fait que une partie est déjà prise en compte dans les angles dièdres et impropres.
Pour inter 1-4:
Dans les autres paires, ces facteurs sont égaux à 1.
25
ELJ = fijLJ eij* rij* rij
!
"
## $
%&&
12
−2 rij*
rij
!
"
## $
%&&
! 6
"
##
$
%
&
&
i<j
∑ Eelec = fijel qi qj
ε rij
i<j
∑
fijLJ = 1 /1.2 fijel =1 / 2
Traitement du solvant
• Solvant explicite : toutes les molécules de solvant sont modélisées
• Solvant implicite : Generalized Born (GB) (contribution électrostatique du solvant
dans le terme énergétique)
∑ ⎟⎟
⎠
⎞
⎜⎜
⎝
⎛ −
−
− j
i GB
j f i
f q e GB q
2 ,
1 1
ε
κ
27
Champ de force ou potentiels d’interaction empirique
∑
∑
∑ − + − + + +
=
φ
φ
θ θ θ θ φ γ
dièdres
n angles
liaisons l V n
k l
l k
E [1 cos( )]
) 2 (
)
( 0 2 0 2 ,
∑< ⎟⎟
⎠
⎞
⎜⎜
⎝
⎛ ⎟
⎠
⎜ ⎞
⎝
− ⎛
⎟⎠
⎜ ⎞
⎝ + ⎛
j
i ij
ij ij
ij ij ijLJ
r r r
e r f
* 6
* 12
* 2
∑<
+ i j ij j el i
ij r
q f q
ε ∑ ⎟⎟
⎠
⎞
⎜⎜
⎝
⎛ −
−
− j
i GB
j f i
f q e GB q
2 ,
1 1
ε
κ
Exemple du
champs de force AMBER
0)2
(ω ω
ω −
=k Eimpropres
∑ −
=liaisons l
liaisons k l l
E ( 0)2
∑< ⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
⎟⎟⎠
⎞
⎜⎜⎝
− ⎛
⎟⎟⎠
⎞
⎜⎜⎝
= ⎛
j
i ij
ij ij
ij ij ijLJ
LJ r
r r
e r f
E
* 6
* 12
* 2
∑<
=i j ij j el i
elec ij r
q f q
E ε
∑ + +
=
φ
φ φ γ
dièdres
n
dièdres V n
E [1 cos( )]
2
,
∑ −
= θ θ θ θ
angles
angles k
E ( 0)2
29
Paramétrisation d’un champ de forces
champ de force = forme fonctionnelle + paramètres
Géométries obtenues par spectro. IR, micro-ondes ou par cristallo. R-X à basse température
→ liaisons l, angles θ, impropres ω
Potentiels de torsion et énergies conformationnelles relatives obtenus par différentes techniques expérimentales ou par calculs ab initio (MQ)
→ angles dièdres ϕ
Géométries et propriétés thermodynamiques (chaleurs latentes) obtenues par analyse de l’empilement cristallin
Propriétés thermodynamiques (densités, enthalpies de vaporisation) obtenues par simulation de liquides
→ paramètres de van der Waals σi σj
Potentiel électrostatique calculé en MQ en différents points autour de la molécule.
→ charges électrostatiques qi qj
D’autres données (fréquences de vibration, propriétés thermo.) peuvent aussi être utilisées
Les paramètres sont affinés graduellement de manière à reproduire de mieux en mieux les données.
Propriétés générales des champs de forces
• Concept du type atomique : pour chaque atome, on décrit - le numéro atomique
- le type d’hybridation (carbone sp3, sp2, …) → influence sur les paramètres géométriques
- l’environnement local (voisins) → influence sur les charges partielles
• "Transférabilité"
Un champ de forces peut être utilisé pour toute une série de molécules
→ Non spécifique, généralisable
→ Évite d’avoir à redéfinir un champ de forces pour chaque molécule
• Un champ de force est empirique
→ Il n’existe pas de forme ‘correcte’ pour un champ de forces
→ C’est un compromis entre précision et efficacité de calcul
Modèle de l’atome unifié
!
31
Il est assez usuel de ne pas représenter
l’ensemble des atomes d’une molécule, dit modèle tout atome, et de représenter un
groupement d’atomes par un unique pseudo- atome « équivalent »
Représentation granulaire
Cα rc γ
Tout atome Trace Cα = sites Réseau élastique
33
Champ de force : réseau élastique
∑ −
=ressorts ij rij rij
E 21γ ( 0)2
i j
rij
rij0 : état natif
Cas des Protéines
• Pour pouvoir faire la modélisation des protéines et appliquer un champs de force, il faut donc les
coordonnées de l’ensemble des atomes de la protéine (et du ligand).
• Dans la PDB, les atomes d’hydrogène ne sont pas marquer: il faut les rajouter.
• Plusieurs logiciels existent pour cela:
– H++ (http://biophysics.cs.vt.edu/)
– Molprobity : http://molprobity.biochem.duke.edu/
Molprobity utilise Reduce pour ajouter les hydrogènes – reduce
Protonation d’une protéine
• La protonation dépend du pH
• Les résidus acido/basiques (besoin des pKa):
• Le cas de l’histidine:
35
Fin cours 2,
TP champs de force et
protonation des protéines
Pour aller plus loin:
sommation d’Ewald
• Difficile de prendre correctement en compte l'électrostatique à longue distance(convergence très lente avec r)
• Calculs pour des systèmes périodiques (cristaux ou MD):
V = Vdir + Vrec + V0
• Description Physique:
-Entourer chaque ion avec une distribution gaussienne de charges de signe opposé et de magnitude égale pour écranter les
interactions -> convergence rapide à courte distance : Vdir
-Ajouter une distribution de charge qui annule la précédente pour que le potentiel global soit identique à l'original
-Cette distribution est sommée dans l'espace réciproque où elle est très rapidement convergeante : Vrec
37
39
• Les vecteur de l'espace réciproque ne sont pas sommés directement
• Les charges sont repositionnée sur une grille tridimensionnelle par interpolation.
• Cette grille subit une transformée de Fourier par un algorithme 3D FFT, le terme d'énergie réciproque est obtenu par sommation dans l'espace réciproque
• Le potentiel sur chaque points de la grille est calculé par une transformation inverse, et en utilisant un facteur d'interpolation on obtient la force sur chaque atome.