• Aucun résultat trouvé

On a vu dans cette introduction que déterminer un ensemble exhaustif des conformations d’une IDP/IDR est un véritable défi. Pour certaines IDPs/IDRs, il est impossible d’avoir des données expérimentales de RMN et/ou de SAXS pour les caractériser. C’est pourquoi lors de cette thèse j’ai essayé de développer une mé-thodologie par dynamique moléculaire pour prédire les conformations possibles d’une IDP/IDR, lorsque l’on n’a aucune information expérimentale. Cette thèse s’est déroulée en deux étapes :

1. la première étape a été d’utiliser une protéine complètement désordonnée (le domaine Verproline de la protéine neuronale du syndrome de Wiskott-Aldrich (N-WASP) qui contient deux motifs WH2 (région homologue 2 de la protéine du syndrome de Wiskott-Aldrich)), pour laquelle nous disposions de données de RMN (grâce à notre collaboration avec Célia Deville et Carine Van Heijenoort) et pour laquelle il était aisé de réaliser des expériences de SAXS, afin de développer notre méthode de dynamique moléculaire et de valider notre protocole grâce aux données expérimentales.

2. Puis dans une deuxième étape, cette méthodologie a été appliquée sur une toute nouvelle protéine bactérienne (DciA de Vibrio cholera) stimula-teur du chargement de l’hélicase DnaB, dont la partie N-terminale, qui est globulaire, a été caractérisée par RMN (par Jessica Andreani de l’équipe de Françoise Ochsenbein (Laboratoire I2BC)) mais dont la partie C-terminale constituée d’une cinquantaine de résidus n’a pas de structure tridimension-nelle quand la protéine est seule en solution. Cette partie IDR n’a pas été caractérisée par RMN mais nous avons pu acquérir des données de SAXS et de CD.

Dans la suite de ce manuscrit vous trouverez quatre chapitres, le premier étant un état-de-l’art des différentes études structurales des IDPs ou IDRs effectuées en couplant des techniques de dynamique moléculaire avec la technique expéri-mentale de RMN et/ou la technique de SAXS. Dans le deuxième, j’ai développé une méthode de simulation permettant de reproduire au mieux les données expé-rimentales locales et globales de la région désordonnée verproline de N-WASP (constitué de 67 résidus). Ayant réussi à obtenir un ensemble conformationnel en accord avec les déplacements chimiques de RMN et les mesures d’intensité

possibilités d’interaction entre cette IDR et l’actine afin de déterminer quels mé-canismes de sélection conformationnelle, ajustement induit ou complexes "fuzzy " étaient privilégiés. Cette étude d’interaction sera reportée dans le troisième cha-pitre. Le dernier chapitre est consacré à une étude par dynamique moléculaire de l’ensemble conformationnel de la protéine bactérienne VcDciA qui possède 111 résidus ordonnés et 46 résidus désordonnés. Les simulations ont été validées grâce aux résultats de SAXS.

Chapitre 2

MD Simulations Combined with

NMR and/or SAXS Data for

Characterizing IDP Conformational

Ensembles

Comme vu dans le chapitre d’introduction, la combinaison de simulations de dynamique moléculaire avec des approches expérimentales, telles que la réso-nance magnétique nucléaire (RMN) et/ou la diffusion de rayons X aux petits angles (SAXS) permet de converger vers une description plus précise et plus exhaustive des conformations adoptées par les IDPs.

Le projet de ma thèse était de trouver une méthodologie pour caractériser le plus exhaustivement possible les différentes conformations d’IDPs/IDRs grâce à la technique de dynamique moléculaire (DM) et de valider cet ensemble confor-mationnel grâce aux données expérimentales de SAXS. Pour commencer, il était nécessaire de faire une bibliographie complète de ce type d’approche. Dans ce chapitre, je discute de l’état-de-l’art de la détermination d’ensembles conforma-tionnels des IDPs générés par des simulations de DM, avec un accent particu-lier sur les études calculant et comparant directement les observables théoriques avec le SAXS et/ou les données expérimentales de RMN (tels que les déplace-ments chimiques (CS),3J-couplages (3Jc), couplages dipolaires résiduels (RDC)). Durant mes trois années de recherche, je me suis intéressée principalement à générer un ensemble conformationnel basé sur la physique par des calculs des forces et d’énergies grâce aux simulations de dynamique moléculaire. Nous avons donc décidé de ne pas répertorier les articles générant des ensembles conforma-tionnels, grâce aux générateurs de pelote statistique, mais seulement ceux de dynamique moléculaire.

Ce chapitre est une adaptation de notre article de revue "MD Simulations Com-bined with NMR and/or SAXS Data for Characterizing IDP Conformational En-sembles", Chan-Yao-Chong, M. and Durand, D. and Ha-Duong, T., Journal of che-mical information and modeling 2019, 59 : 1743-1758 (doi : 10.1021/acs.jcim.8b00928).

Introduction

In contrast to folded proteins, intrinsically disordered proteins (IDPs) sample very heterogeneous conformations and cannot be described by one or a few three-dimensional (3D) structures but rather by an ensemble of many diverse ones. Several biophysical experiments can be employed to structurally characte-rize IDP conformational ensembles [34, 98, 228, 285, 349, 366], among which nu-clear magnetic resonance (NMR) spectroscopy and small-angle X-ray scattering (SAXS) appear simple to apply and very complementary. Indeed, NMR measure-ments of residue-specific chemical shifts (CS) or residual dipolar couplings (RDC) provide information on IDP propensity to form transient local secondary struc-tures [183, 187], while SAXS intensities can inform about the IDP bound/unbound state, degree of disorder, as well as their global shape and size [171, 284]. Ho-wever, a problem inherent to disordered proteins is to infer ensembles of 3D conformations from sparse or low-resolution data. This degeneracy issue (dif-ferent ensembles can fit the same experimental data) makes the determination of IDP conformational ensembles particularly challenging.

There are mainly three different strategies to derive IDP conformational en-sembles using experimental information [30, 108, 153, 228, 282] (Fig. 2.1). The first one consists of using experimental data as restraints to guide the generation of an ensemble that agrees with experiments (restrained sampling). The second one consists of generating a pool of conformations and then optimizing the sta-tistical weight of each structure to minimize the deviation between theoretical and experimental quantities (ensemble reweighting). Finally, the third strategy consists of generating a conformational ensemble as realistic as possible and assessing its quality against experimental measurements (ensemble validation).

In these strategies, ensembles of IDP conformations can be generated using several computational approaches [108, 280, 282], among which statistical coil generators and molecular dynamics (MD) simulations are the most popular. The general principle of statistical coil generators, such as TraDES [104], Flexible-Meccano (FM) [256], or the more recent database-Markov method [69] and three-residue-based sampling [100], is to construct multiple conformations of a polypep-tide main chain by assigning, to each amino acid, some φ/ψ values randomly taken in residue-specific datasets derived from experimentally determined structures of proteins. These very fast methods are, in essence, knowledge-based approaches, which generally require, to be accurate, the input of amino acid secondary struc-ture propensities, either determined by experiments or predicted by computational techniques.

An alternative to statistical coil generators is the MD simulation approach which can potentially generate realistic IDP conformational ensembles. Indeed, based on physics principles, MD simulations naturally provide the Boltzmann probabi-lity or statistical weight of each structure of a conformational ensemble, avoiding the problem of degenerate solutions. However, this approach must overcome two limitations to provide relevant results : first, the force fields must describe the in-teratomic interactions as accurately as possible, particularly those between water molecules and apolar amino acids, which are frequently exposed to solvent in

di-Characterizing IDP Conformational Ensembles

FIGURE 2.1 – Strategies to generate IDP conformational en-semble that fit experimental data : NMR data, such as chemical shifts (CS),3J-couplings (3Jc), or residual dipolar couplings (RDCs) provide information on IDP propensity to form transient local secon-dary structures. Small-angle X-ray scattered intensities I(q), as a function of the scattering momentum transfer (q), provide informa-tion regarding the shape of the scattering object and its size through the radius of gyrationRg, estimated from the Guinier approximation :

I(q) =I(0)exp(−q2R2

g/3)for sufficiently small values of q [160].

for the classical force fields AMBER and CHARMM [25, 152, 268]. Second, ex-plorations of IDP conformational ensembles must be as exhaustive as possible, which generally requires computationally expensive calculations, which can last up to several months. Several excellent review articles discussed the develop-ments and applications of enhanced sampling techniques to generate statistically correct IDP conformational ensembles [236, 280, 310].

Given the better accuracy of all-atom force fields and the more and more po-werful high-performance computers, MD simulations have become a major ap-proach to correctly characterize protein conformational ensembles. In the present review, we provide a survey of the recent achievements of MD simulations for generating realistic conformational ensembles of various IDP that agree with ex-perimental data. We will particularly emphasize the MD studies that were able to fit both NMR and SAXS measurements, indicating both local and global correct structures. We hope that this review will encourage the molecular modeling com-munity to validate IDP ensembles with both NMR and SAXS data and possibly deposit their structures in the Protein Ensemble Database (pE-DB) [356]. In the first part of this review, we will recall the studies that use experimental data to assess the MD simulation approach, especially those which develop force fields and enhanced sampling techniques for IDP. In the second part, we will shortly

survey the methods to refine IDP conformational ensembles generated by MD si-mulations. Lastly, we will discuss the contribution of recent MD studies combining NMR and SAXS measurements to our understanding of IDP biological functions, notably the role of the transient secondary structures and compactness in their binding mechanism to protein partners.

It should be noted that studies using paramagnetic relaxation enhancement (PRE) experiments will not be considered in this review. The results provided by this NMR technique are more difficult to process than standard NMR expe-riments, as shown by Sasmal et al. [305], because it requires to introduce a re-porter tag which can induce some perturbations in structural ensembles. Similarly, this review will not include many studies of IDPs that use fluorescence resonance energy transfer (FRET) measurements which also provides useful information on IDP overall size [116, 222].

2.1 NMR and SAXS data for validating MD

Documents relatifs