• Aucun résultat trouvé

Modélisation des complexes et simulations

6.3 Modélisation des complexes et simulations

6.3.1 Modélisation des complexes

51 complexes Tiam1:peptide ont été modélisés (tableaux 6.1 et 6.2). Les structures cristal- lographiques du domaine PDZ de Tiam1 lié aux peptides Syndecan1 (Sdc1), Caspr4, Neurexine (Neu) et au peptide consensus sont utilisées comme points de départ. Afin d’être le plus parci- monieux possible et limiter le nombre de modifications, la structure la plus proche du variant à modéliser est choisie. Ainsi, les dix complexes impliquant le peptide Caspr4 et son variant F0A ont été modélisés à partir de la structure du complexe QM:Caspr4. Les deux complexes liés à la Neurexine ont été modélisés à partir du complexe QM:Neu. Tous les autres complexes ont été modélisés à partir du complexe Tiam1:Sdc1.

Le positionnement des chaines latérales modifiées au niveau du peptide et/ou de la protéine est effectué avec le programme SCWRL4 (Krivov et al. [2009]). Les chaines latérales à moins de 4 Å des sites de mutations sont également autorisées à changer de rotamère. Dans la structure du complexe QM:Caspr4, l’extrémité N-terminale du peptide est désordonnée, la structure des deux premiers résidus n’est donc pas résolue. Les atomes manquants sont ajoutés en se basant sur la structure du complexe WT:Sdc1 puis leur position est ajustée à l’aide d’une étape de minimisation suivie d’une courte dynamique sous contraintes. Le reste du peptide Caspr4 a également une conformation différente de celle de Sdc1 (figure 6.3). Les 10 complexes impliquant Caspr4 sont construits à partir de ce modèle. L’extrémité N-terminale de chaque peptide est neutralisée par un groupement acétyle.

6.3.2 Modélisation de la 2-méthylalanine

La 2-méthylalanine (mAla ou Aib) est un acide aminé non présent dans les protéines et retrouvé dans certains polypeptides antibiotiques produits par les champignons. Il correspond

à une alanine pour laquelle le Hα est remplacé par un méthyle. Il est capable d’augmenter

la résistance des peptides aux protéases (Yamaguchi et al. [2003]), les rendant plus stables in

vivo. Afin de déterminer si cette approche est applicable à Tiam1, des mutants des peptides

Sdc1 et Caspr4 avec une mAla à la position P0 ont étés modélisés.

Les paramètres de la mAla pour le champ de force Amber n’étant pas disponibles, une étape de paramétrisation a été nécessaire. Le modèle tridimensionnel de la mAla a été construit ma-

Figure 6.3 – Superposition des structures des complexes Tiam1:Sdc1 et QM:Caspr4. Pour chaque complexe, le squelette du peptide est représenté en bâtons.

Tiam1:Sdc1 et QM:Caspr4 sont respectivement en gris et en bleu. Les atomes du peptide Caspr4 reconstruits sont en bleu clair.

nuellement à partir d’un résidu Ala acétylé en remplaçant le Hα par un groupement méthyle.

Le modèle ainsi obtenu a ensuite été minimisé à l’aide du programme Gaussian 9 puis les charges partielles des différents atomes ont été déterminées par l’approche de Merz-Singh- Kollman (Singh & Kollman [1984]). Le modèle utilisé est celui de Hartree-Fock (Roothaan [1951]) avec la base 6-31G(d). Les charges partielles obtenues sont finalement légèrement ajus- tées à la main pour respecter la symétrie de la molécule. Ce niveau de description quantique est couramment utilisé pour étendre le champ de force ff99SB.

6.3.3 Simulations de dynamique moléculaire

Pour chaque complexe, une simulation de dynamique moléculaire en solvant explicite est effectuée. Les modèles produits par SCWRL4 sont préparés à l’aide du serveur Charmm GUI (Brooks et al. [2009] ; Sunhwan et al. [2008]). Les complexes sont immergés dans une boîte d’eau TIP3P (Jorgensen et al. [1983]) puis neutralisés à l’aide de quelques ions sodium. L’état de protonation des histidines est déterminé par inspection visuelle des structures et par le programme PropKa (Olsson et al. [2011]). Les systèmes sont ensuite minimisés pendant 1000 pas par la méthode du gradient conjugué en contraignant les atomes lourds puis en relâchant progressivement les contraintes. Une phase d’équilibration de 500 ps est ensuite effectuée en augmentant progressivement le pas d’intégration et la température et en supprimant progres- sivement les contraintes appliquées au squelette de la protéine. Les simulations sont effectuées

6.3. Modélisation des complexes et simulations

à température et pression constantes (300 K et 1 bar) en utilisant le thermostat et le barostat de Nosé-Hoover (Nosé [1984] ; Hoover [1985]). Les interactions électrostatiques sont traitées par la méthode du Particle Mesh Ewald ou PME (Darden et al. [1993]). Le champ de force Amber ff99SB a été utilisé (Cornell et al. [1996]). Des simulations de 40 à 100 ns ont été pro- duites à l’aide du logiciel NAMD 2.12 (Phillips et al. [2005]), la longueur de chaque simulation dépendant du degré de convergence des composantes énergétiques utilisées par les modèles. Seuls les complexes Tiam1:Sdc1 et QM:Caspr4 sont prolongés jusqu’à 500 ns.

Lors des simulations, l’extrémité N-terminale du peptide est maintenue liée à Tiam1 par une contrainte non-invasive. L’énergie de contrainte est nulle tant que le peptide est à moins de 3 Å de la protéine. Au-delà de cette limite, une contrainte semi-harmonique est appliquée

avec une constante de force de 3 kcal/mol/Å2. Cette contrainte a été appliquée en raison

du détachement occasionnel de l’extrémité N-terminale au cours de simulations tests, pouvant entrainer des fluctuations énergétiques importantes, impossibles à échantillonner correctement en 100 ns.

Pour 16 des 51 complexes, malgré les contraintes appliquées au niveau de l’extrémité N- terminale, la structure s’écarte de la structure cristallographique, notamment au niveau de

l’hélice α2. Le modèle PB/LIE mono-trajectoire que nous allons utiliser n’est pas capable de

décrire l’énergie libre associée aux changements conformationnels pour des raisons que nous détaillerons plus loin. Pour ces complexes, des contraintes semi-harmoniques supplémentaires sont donc ajoutées pour maintenir les structures dans une conformation proche de la structure cristallographique. L’énergie de contrainte est prise en compte dans les calculs d’énergies libres de liaison. Ce terme est inférieur à 0,30 kcal/mol dans la plupart des cas, excepté pour les complexes L911M:Caspr4 et Tiam1:YAAGRKHF pour lesquels cette valeur est respectivement de 0,39 et 0,66 kcal/mol.

Un temps de simulation de 100 ns semble suffisant comme en attestent les valeurs de RMSD par rapport aux structures initiales (figure 6.4). De plus, les structures des 51 modèles restent très proches les unes des autres au cours des simulations puisque les valeurs RMSD calculées sur le squelette entre les structures moyennes de chaque modèle sont comprises entre 0,6 et 2,1 Å. L’interface protéine-peptide reste également très proche de la structure cristallographique avec des RMSD compris entre 0,7 et 1,5 Å.

A

RMS D (A) Temps (ns) 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 0 50 100 150 200 250 300 350 400 450 500 −10 −8 −6 −4 −2 0 2 4 0 50 100 150 200 250 300 350 400 450 500 Δ PB (kca l/mol ) −70 −65 −60 −55 −50 −45 −40 −35 −30 0 50 100 150 200 250 300 350 400 450 500 Δ vdW (kcal/mo l) −1550 −1500 −1450 −1400 −1350 −1300 −1250 −1200 −1150 0 50 100 150 200 250 300 350 400 450 500 Δ SAS A (A 2) Temps (ns)

B

0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 0 10 20 30 40 50 60 70 80 90 100 RMS D (A) Temps (ns) Δ PB (kca l/mol ) −10 −8 −6 −4 −2 0 2 4 6 10 20 30 40 50 60 70 80 90 100 −70 −65 −60 −55 −50 −45 −40 −35 −30 10 20 30 40 50 60 70 80 90 100 Δ vdW (kcal/mo l) −1550 −1500 −1450 −1400 −1350 −1300 −1250 10 20 30 40 50 60 70 80 90 100 Δ SAS A (A 2) Temps (ns)

Figure 6.4 – Stabilité des structures et des composantes énergétiques au cours des simulations de dynamique moléculaire. Les complexes Tiam1:Sdc1 et QM:Sdc1 sont

respectivement représentés en A et B. Pour chaque système, quelques structures issues de la dynamique moléculaire sont superposées. Le RMSD a été calculé par rapport à la structure initiale. Les termes énergétiques ont été extraits de la dynamique en prenant une conformation toutes les 20 ps.

6.3. Modélisation des complexes et simulations

6.3.4 Extraction des termes énergétiques

À partir des trajectoires de dynamique moléculaire, des conformations sont extraites toutes les 20 ps et utilisées pour calculer les différents termes énergétiques pris en compte dans les modèles. Les 10 premières nanosecondes sont systématiquement exclues pour permettre aux structures de se relaxer. Entre 1500 et 4500 conformations par simulation sont donc utilisées. Nous utilisons ici la méthode de calcul mono-trajectoire, ce qui signifie que la simulation du complexe est utilisée pour décrire aussi bien l’état associé que dissocié. Pour cela, les composantes énergétiques sont successivement calculées en prenant en compte les atomes du complexe, du peptide et de la protéine. Le terme de van der Waals est directement extrait des

énergies du champ de force. La contribution électrostatique ∆Gelecest estimée soit à l’aide d’un

terme PB, soit d’un terme GB. Pour une conformation donnée, les molécules du solvant sont retirées et l’énergie libre électrostatique est calculée à partir d’un continuum électrostatique. La

protéine et son ligand ont une constante diélectrique P et le solvant une constante diélectrique

W. Lorsque le PB est utilisé, la valeur du potentiel électrostatique est calculée en résolvant

numériquement l’équation de Poisson-Boltzmann en utilisant une grille cubique et la méthode des différences finies implémentée dans Charmm (Im et al. [1998]). La grille est composée de 181 plans dans chaque direction séparés de 0,8 Å. Les charges utilisées sont celles du champ de force Amber ff99SB. Le potentiel aux limites extérieures de la grille est approximé par le potentiel de Debye-Hückel produit par ces charges. Pour chaque structure un second calcul est effectué avec une maille plus fine (0,4 Å), en utilisant le potentiel de la grille issue du premier calcul comme condition aux bords. Cette méthode appelée focusing permet d’obtenir une meilleure estimation du potentiel électrostatique (Gilson et al. [1988]). La concentration

en ions est fixée à 100 mM tandis que les constantes diélectriques du solvant (W) et du soluté

(P) sont respectivement de 80 et 8. Pour délimiter les deux régions du système, nous utilisons

ici un jeu de rayons atomiques optimisés pour le PB avec les champs de force Amber (Swanson

et al. [2005]).

Pour les calculs GB, une version modifiée du programme Xplor a été utilisée (Brünger

[1992]). Cette version implémente la méthode GBHCT développée par Hawkins et al. [1995]

qui est très similaire au variant utilisé dans Amber (Onufriev et al. [2002]). Le modèle a été paramétré pour être utilisé avec les charges de Amber (Lopes et al. [2007]).

L’erreur statistique des énergies libres calculées est obtenue en divisant chaque trajectoire en N partitions de 5 ns. L’incertitude est ensuite estimée de la manière suivante :

σ(∆G) =

q

var(∆G)/(N − 1) (6.2)

avec var(∆G) la variance des N ∆G. Pour estimer l’incertitude de la valeur des ∆∆Gb,

la variance du complexe d’intérêt est ajoutée à celle de la référence. Toutes les incertitudes obtenues sont comprises entre 0,1 et 0,2 kcal/mol ce qui semble indiquer que les simulations sont suffisamment longues malgré les oscillations parfois observées pour certaines composantes (figure 6.4B).