Modélisation Multi-échelle: Modélisation des Macromolécules biologiques Séance 2 (1H30)

(1)

1

Modélisation Multi-échelle:

Modélisation des Macromolécules biologiques Séance 2 (1H30)

Cours de Master M2 Isabelle Navizet

Isabelle.navizet@u-pem.fr

Laboratoire Modélisation et Simulation Multi-Echelle (MSME)

(2)

Résumé du cours 1:

La Modélisation Moléculaire : Pourquoi ?

•  Déterminer la configuration atomique d’un système.

•  Évaluer des propriétés physico-chimiques du système étudié.

•  Pour les protéines: interactions avec des ligands

(médicaments, polluants, poisons, chromophores…)

•  Prédiction

•  Visualisation des protéines (VMD TP1)

(3)

3

Phase condensée réelle Modèle

Résultats expérimentaux

Propriétés calculées

Prédictions théoriques

Expériences Simulations

numériques

Théories: solutions analytiques

Analyse de spectres complexes

Comparaison Comparaison Ajustement des potentiels

d’interaction Test des modèles Affinement des théories

Modélisation

•  Description microscopique des molécules en phase condensée

•  Calculs de propriétés inaccessibles par l’expérience

•  Simulation d’expériences et de réactions chimiques et biologiques

•  Visualisation des structures et de leur dynamique

(4)

Les différentes étapes des études de Modélisation

Moléculaire

•  Le choix du système de coordonnées

•  Le choix de la description des interactions

•  Le choix de la méthode de calcul

•  L’analyse des résultats

(5)

5

Le système de coordonnées

•  Coordonnées cartésiennes : x, y, z

•  Coordonnées internes : longueurs des liaisons, angles de valence et angles de torsion.

•  Réseau granulaire : carbones α

Résidu i i+1 i-1

χ

(6)

Descriptions des interactions

•  Mécanique Quantique (résolution de l’équation de Schrödinger)

- Traite les électrons d’un système: résolution de l’équation de Schrödinger

- Limitée à des systèmes comportant un faible nombre d’atomes

•  Mécanique Moléculaire (méthode à champ de forces), méthode dite

« classique »

- Détermination de la fonction d’énergie potentielle ou champ de forces qui décrit les interactions atomiques inter- et

intramoléculaires

(7)

7

Mécanique moléculaire

- Ignore le mouvement des électrons

- Calcule l’énergie d’un système comme une fonction des positions des noyaux uniquement.

- Ne peut pas casser ou créer de liaisons covalentes

- Dédiée aux systèmes comportant un grand nombre d’atomes

- Basée sur une fonction d’énergie potentielle empirique (ou champ de force)

- Basée sur

- L’approximation de Born-Oppenheimer (adaptation instantanée des e- aux mouvements des noyaux)

- Modèles d’interactions simples

(8)

Energie potentielle d’interaction:

•  De façon générale, l’énergie potentielle d’interaction total de N particules :

•  r représente la position de la particule i,

•  u1 représente l’énergie potentielle due à un champ extérieur au système de particules, comme la gravité, un champ électrique …,

•  u2 correspond aux interactions d’une paire de particules

•  u3 représente les interactions d’un triplet de particules et ainsi de suite.

⇒ approximation à 2 corps : énergie potentielle effective

les forces dérivent de l’énergie potentielle Ui,

!

(9)

Energies potentielles polyatomiques

•  Termes d’énergie liée : liaison entre les atomes

•  Termes d’énergie non liée : pas de liaison entre les atomes

9

(10)

Molécules rigides

•  Si petite molécule : structure considérée comme rigide

•  Exemple de l’eau: TIP3P, TIP4P:

3 points pour TIP3P (1 oxygène et 2 atomes d’hydrogène)

4 points pour TIP4P (1 O, 2 H et un point M fictif sur la médiane entre les deux H)

•  Pour TIP3P, la charge partielle négative localisée sur O est contrebalancée par les charges partielles positives localisées sur les H.

•  Pour TIP4P, la charge localisée sur M est contrebalancée par les charges localisées sur les H.

•  Les interactions de van der Waals entre deux molécules d’eau sont calculées comme des interactions de Lennard-Jones (cf interaction intermoléculaires) entre les oxygène. Aucune interaction de van der Waals n’est prise en compte faisant intervenir les H.

(https://fr.wikipedia.org/wiki/Modèle_d'eau)

(11)

Champs de force pour l’eau

h1p://www1.lsbu.ac.uk/water/water_models.html An example: TIP3P model

k_C, the electrostaCc constant: 332.1 Å·kcal/mol q_i are the parCal charges

r_ij is the distance between two atoms or charged sites;

A and B are the Lennard-Jones parameters.

The lenght O-H and angle HOH are ﬁxed.

Diﬀerent models:

The charged sites may be on the atoms or on dummy sites (such as lone pairs). In most water models, the Lennard-Jones term applies only to the interacCon between the oxygen atoms

(12)

Molécule flexible

•  L’énergie intramoléculaire d’une molécule flexible provient de quatre termes :

-l’énergie de liaison (élongation) -l’énergie due à l’angle de pliage

-l’énergie due à l’angle dièdre (entre deux plans)

-l’énergie de longue portée entre atomes voisins (potentiel effectif de type Lennard-Jones ).

•  Ainsi, lorsque l’on s’attache à décrire des molécules

articulées il est important d’intégrer ces degrés de liberté interne représentés par l’élongation, la flexion et la torsion.

(13)

1) L’élongation

!

13

!

(14)

2) Le pliage U

_θ

= ½ k

_θ

( θ - θ

_o

)

²

!

(15)

3) La torsion

!

15

!

U_ϕ = V_n,_ϕ

2 [1+cos(nϕ +γ^)]

n=0 N

∑

• Vn donne une idée sur la hauteur de la barrière (il manque les termes non liés 1,4 qui contribuent aussi à la hauteur de la barrière).

• n est la multiplicitée : il donne le nombre de minima de la fonction entre 0 et 2π.

• γ est le facteur de phase : il donne la valeur de φ pour laquelle la fonction est maximale.

(16)

Energie de torsion

• Ethane CH3-CH3 n=3, γ=0°,

• VHCCH= V (1+cos(3φ))

Ethylène CH2=CH2 n=2, γ=180°, VHCCH= V (1+cos(2φ-180))

•  CH2X-CH2X VXCCX= V1+V2+V3

(17)

Torsion impropre

•  Parfois, il est également nécessaire d’introduire un autre potentiel lié à la

torsion dite impropre (mouvement d’un atome dans un plan formé par trois

autres).

17

!

0 2 12 _w(w- w )

= k E_impropres

(18)

4) Potentiel longue porté

L’énergie de longue portée est introduite en utilisant un potentiel effectif (de type Lennard-Jones par exemple) entre

atomes séparés par plus de trois liaisons

(19)

Potentiel intermoléculaire

•  Forces répulsives :

forces répulsives dues au recouvrement des nuages électronique, dont l’énergie potentielle décroît en r^-1à courte distance et exponentiellement à plus grande distance exp(-2r/a₀). On l’appelle aussi interaction stérique.

•  Forces attractives :

On les décompose souvent en trois termes, qui des plus fortes aux plus faibles sont : les interactions ioniques (200-500 kJ/mol) (en r^-1),

les liaisons hydrogène (»20 kJ/mol) et les forces de van der Waals (0.5-3 kJ/mol):

-les forces de dispersion (ou forces de London) attractives (interactions dipôle induit - dipôle induit). Le potentiel associé est en r^-6.

-les forces d’induction (forces de Debye) (interactions dipôle – dipôle induit). Le potentiel correspondant est en r^-6.

-les forces dipolaires (forces de Keesom) (interactions dipôle – dipôle). Le potentiel, directionnel, associé est en en r^-3, et se ramène à un potentiel en en r^-6 lorsque les molécules sont en rotation rapide (non directionnel).

19

(20)

Modélisation des interactions non polaires:

Potentiel sphère dure (à gauche) et potentiel sphère molle (à droite) pour α^=12.

(21)

Potentiel carré (à gauche) ou σ ₂=1,5σ₁ et potentiel de Lennard-Jones 12-6 (à droite).

les valeurs attribuées la majorité du temps aux paramètres sont fonctions de l’état thermodynamique et de la propriété que l’on veut simuler.

(22)

Simple troncature

Troncature

et déplacement Problème à longue portée

(23)

Troncature et switch

(24)

Interactions électrostatiques

!

où les q sont les charges sur les sites i et j et ε₀ est la permittivité du vide.

Calculs pour les longues portées car décroissance en r ^-1 : sommation d’Ewald

(25)

Remarques:

Des facteurs correcteurs dans les interactions LJ et électrostatique sont pris en compte pour les

interactions de type 1-4 (j=i+ 3, 3 liaisons entre i et j) pour compenser le fait que une partie est déjà prise en compte dans les angles dièdres et impropres.

Pour inter 1-4:

Dans les autres paires, ces facteurs sont égaux à 1.

25

E_LJ = f_ij^LJ e_ij^* r_ij^* r_ij

!

"

## $

%&&

12

−2 r_ij^*

r_ij

!

"

## $

%&&

! 6

"

##

$

%

&

i<j

∑ _E_elec ₌ _f_ij^el ^qⁱ ^q^j

ε ^r_ij

i<j

∑

f_ij^LJ = 1 /1.2 f_ij^el =1 / 2

(26)

Traitement du solvant

•  Solvant explicite : toutes les molécules de solvant sont modélisées

•  Solvant implicite : Generalized Born (GB) (contribution électrostatique du solvant

dans le terme énergétique)

∑ _⎟^⎟

⎠

⎞

⎜⎜

⎝

⎛ −

−

− j

i GB

j f i

f q e ^GB q

2 ,

1 1

ε

κ

(27)

27

Champ de force ou potentiels d’interaction empirique

∑

∑ ⁻ ⁺ ⁻ ⁺ ⁺ ⁺

=

φ

θ θ θ θ φ γ

dièdres

n angles

liaisons l V n

k l

l k

E [1 cos( )]

) 2 (

)

( ₀ ² ₀ ² ^,

∑< ⎟⎟

⎠

⎞

⎜⎜

⎝

⎛ ⎟

⎠

⎜ ⎞

⎝

− ⎛

⎟⎠

⎜ ⎞

⎝ + ⎛

j

i ij

ij ij

ij ij ijLJ

r r r

e r f

* 6

* 12

* 2

∑<

+ i j ij j el i

ij r

q f q

ε ∑ _⎟^⎟

⎠

⎞

⎜⎜

⎝

⎛ −

−

− j

i GB

j f i

f q e ^GB q

2 ,

1 1

ε

κ

Exemple du

champs de force AMBER

(28)

0)2

(ω ω

ω −

=k E^impropres

∑ ⁻

=liaisons l

liaisons k l l

E ( ₀)²

∑< ⎟⎟

⎠

⎞

⎜⎜

⎝

⎛

⎟⎟⎠

⎞

⎜⎜⎝

− ⎛

⎟⎟⎠

⎞

⎜⎜⎝

= ⎛

j

i ij

ij ij

ij ij ijLJ

LJ r

r r

e r f

E

* 6

* 12

* 2

∑<

=i j ij j el i

elec ij r

q f q

E ε

∑ ⁺ ⁺

=

φ

φ φ γ

dièdres

n

dièdres V n

E [1 cos( )]

2

,

∑ ⁻

= θ θ θ θ

angles

angles k

E ( ₀)²

(29)

29

Paramétrisation d’un champ de forces

champ de force = forme fonctionnelle + paramètres

Géométries obtenues par spectro. IR, micro-ondes ou par cristallo. R-X à basse température

→ liaisons l, angles θ, impropres ω

Potentiels de torsion et énergies conformationnelles relatives obtenus par différentes techniques expérimentales ou par calculs ab initio (MQ)

→ angles dièdres ϕ

Géométries et propriétés thermodynamiques (chaleurs latentes) obtenues par analyse de l’empilement cristallin

Propriétés thermodynamiques (densités, enthalpies de vaporisation) obtenues par simulation de liquides

→ paramètres de van der Waals σ_i σ_j

Potentiel électrostatique calculé en MQ en différents points autour de la molécule.

→ charges électrostatiques q_i q_j

D’autres données (fréquences de vibration, propriétés thermo.) peuvent aussi être utilisées

Les paramètres sont affinés graduellement de manière à reproduire de mieux en mieux les données.

(30)

Propriétés générales des champs de forces

• Concept du type atomique : pour chaque atome, on décrit - le numéro atomique

- le type d’hybridation (carbone sp3, sp2, …) → influence sur les paramètres géométriques

- l’environnement local (voisins) → influence sur les charges partielles

• "Transférabilité"

Un champ de forces peut être utilisé pour toute une série de molécules

→ Non spécifique, généralisable

→ Évite d’avoir à redéfinir un champ de forces pour chaque molécule

• Un champ de force est empirique

→ Il n’existe pas de forme ‘correcte’ pour un champ de forces

→ C’est un compromis entre précision et efficacité de calcul

(31)

Modèle de l’atome unifié

!

31

Il est assez usuel de ne pas représenter

l’ensemble des atomes d’une molécule, dit modèle tout atome, et de représenter un

groupement d’atomes par un unique pseudo- atome « équivalent »

(32)

Représentation granulaire

Cα r_c γ

Tout atome Trace Cα = sites Réseau élastique

(33)

33

Champ de force : réseau élastique

∑ −

=ressorts ij rij rij

E 21γ ( ⁰)²

i j

r_ij

r_ij⁰: état natif

(34)

Cas des Protéines

•  Pour pouvoir faire la modélisation des protéines et appliquer un champs de force, il faut donc les

coordonnées de l’ensemble des atomes de la protéine (et du ligand).

•  Dans la PDB, les atomes d’hydrogène ne sont pas marquer: il faut les rajouter.

•  Plusieurs logiciels existent pour cela:

–  H++ (http://biophysics.cs.vt.edu/)

–  Molprobity : http://molprobity.biochem.duke.edu/

Molprobity utilise Reduce pour ajouter les hydrogènes –  reduce

(35)

Protonation d’une protéine

•  La protonation dépend du pH

•  Les résidus acido/basiques (besoin des pKa):

•  Le cas de l’histidine:

35

(36)

Fin cours 2,

TP champs de force et

protonation des protéines

(37)

Pour aller plus loin:

sommation d’Ewald

•  Difficile de prendre correctement en compte l'électrostatique à longue distance(convergence très lente avec r)

•  Calculs pour des systèmes périodiques (cristaux ou MD):

V = Vdir + Vrec + V₀

•  Description Physique:

-Entourer chaque ion avec une distribution gaussienne de charges de signe opposé et de magnitude égale pour écranter les

interactions -> convergence rapide à courte distance : Vdir

-Ajouter une distribution de charge qui annule la précédente pour que le potentiel global soit identique à l'original

-Cette distribution est sommée dans l'espace réciproque où elle est très rapidement convergeante : Vrec

37

(38)

(39)

39

• Les vecteur de l'espace réciproque ne sont pas sommés directement

• Les charges sont repositionnée sur une grille tridimensionnelle par interpolation.

• Cette grille subit une transformée de Fourier par un algorithme 3D FFT, le terme d'énergie réciproque est obtenu par sommation dans l'espace réciproque

• Le potentiel sur chaque points de la grille est calculé par une transformation inverse, et en utilisant un facteur d'interpolation on obtient la force sur chaque atome.