• Aucun résultat trouvé

Stabilité des séquences produites en simulation de dynamique moléculaire

À partir des séquences Proteus générées, les modèles tridimensionnels sont reconstruits. La stabilité de ces structures est ensuite analysée par dynamique moléculaire. La séquence native ainsi que le quadruple mutant (QM), moins stable expérimentalement, sont utilisés comme références.

4.3.1 Préparation des systèmes

Les structures générées sont solvatées dans une boîte d’eau explicite TIP3P octaédrique avec une distance minimale entre la protéine et les bords de la boîte de 13 Å, puis la charge du

système est neutralisée à l’aide d’ions Na+ ou Cl−. Le système est ensuite minimisé pendant

1000 pas en imposant des contraintes harmoniques sur le squelette et en relâchant progressi- vement les contraintes sur les chaines latérales. On utilise successivement les algorithmes de

Steepest descent et Newton-Raphson. Le champ de force AMBER ff99SB est utilisé, les liaisons

covalentes impliquant des hydrogènes sont maintenues fixes à l’aide de l’algorithme SHAKE (Ryckaert et al. [1977]). Le pas d’intégration est de 2 fs. Les simulations sont maintenues à température et pression ambiantes par un thermostat et un barostat de Nose-Hoover (Nosé [1984] ; Hoover [1985]). Les interactions électrostatiques à longue portée sont traitées par la méthode Particule Mesh Ewald (PME, Cornell et al. [1996]). Le système est équilibré pen- dant 200 ps en augmentant progressivement le pas d’intégration et la température jusqu’aux valeurs cibles, tout en relâchant progressivement les contraintes sur le système. Une fois les systèmes équilibrés, des dynamiques de 100 ns sont effectuées à l’aide du programme NAMD 2.12 (Phillips et al. [2005]). Les simulations les plus stables sont prolongées, pour des durées totales comprises entre 200 ns et 1200 ns.

4.3.2 Critères de stabilité

Pour analyser la stabilité des séquences, plusieurs descripteurs sont comparés aux valeurs observées pour les formes apo et holo de la séquence native et du quadruple mutant. Le quadruple mutant est expérimentalement moins stable que la séquence native puisqu’il présente une énergie libre de dépliement de 0,82 ± 0,09 kcal/mol contre 2,60 ± 0,13 kcal/mol pour la

4.3. Stabilité des séquences produites en simulation de dynamique moléculaire

séquence native (Liu et al. [2016]). Ainsi, à température ambiante une large fraction de ce mutant est déstructurée (environ 20%).

4.3.2.1 Convergence des simulations

La convergence des simulations est mesurée en calculant l’écart quadratique moyen (RMSD pour Root Mean Square Deviation). Cette mesure permet d’étudier les fluctuations du système autour d’une conformation de référence. Dans notre cas, nous utilisons deux structures de référence distinctes. La première correspond à la structure initiale qui est donc très proche de la structure cristallographique de Tiam1 et qui permet de voir si la structure au cours de la simulation s’éloigne de la structure native. Mais cet éloignement ne signifie pas forcément que la structure est instable. En effet, la modification de la séquence peut stabiliser une conformation différente de la conformation native. C’est pourquoi une deuxième mesure du RMSD est effectuée en prenant comme référence la structure la plus proche de la structure moyenne de la dynamique. Le RMSD est calculé sur les atomes lourds du squelette protéique. Les extrémités de la protéine (résidus 837-841 et 927-930) étant très flexibles, ils sont exclus du calcul pour ne pas bruiter les résultats. De même, une seconde mesure du RMSD est effectuée

en excluant la boucle flexible β12 (résidus 851-856).

4.3.2.2 Fluctuations atomiques

Le RMSF (Root Mean Square Fluctuation) autour de la structure moyenne décrit les fluc- tuations atomiques au cours de la simulation pour chaque atome du système. Nous nous intéresserons à l’atome Cα de chaque résidu. Cette mesure permet de localiser des régions de la protéine dont la dynamique serait modifiée dans les séquences Proteus.

4.3.2.3 Rayon de giration

Le rayon de giration, noté Rg, donne une mesure de la compacité du système et peut être un indicateur des changements structuraux et du dépliement partiel ou complet de la protéine. Il s’écrit : Rg = sP imi(ri− rCM)2 P imi (4.2)

où rCM est la position du centre de masse de la protéine, ri est la position et mi la masse de

4.3.2.4 Stabilité des structures secondaires

Le repliement de la protéine dépend en grande partie de la présence des structures secon- daires. De ce fait, ces dernières constituent un très bon indicateur de stabilité. Pour suivre la stabilité des structures secondaires au cours des simulations, le programme DSSP est uti- lisé (Kabsch & Sander [1983]). Ce dernier se base sur la présence de liaisons hydrogène pour déterminer si un résidu est impliqué dans une structure secondaire ou non.

4.3.2.5 Analyse en composantes principales (ACP)

Afin de dégager les mouvements dynamiques globaux, l’analyse en composantes principales (ACP) est utilisée. Cette approche réduit la dimension des données en identifiant des combi- naisons linéaires des coordonnées, appelées composantes principales (PC), qui préservent la variance des données. Elle permet de mettre en évidence l’existence de mouvements globaux et concertés.

La matrice de covariance des coordonnées des atomes Cα est calculée et pondérée par les masses atomiques, puis diagonalisée. Les valeurs propres correspondent à des déplacements corrélés et les vecteurs propres à leur amplitude. À partir de ces composantes, plusieurs ana- lyses peuvent être effectuées. Il est notamment possible de projeter les conformations extraites de la trajectoire dans un plan défini par deux composantes pour étudier la réversibilité des mouvements de la protéine. La contribution de chaque résidu peut également être calculée pour déterminer quels résidus sont les plus flexibles. Enfin, la direction et l’amplitude des mouvements de chaque composante peuvent être visualisées sur la structure tridimensionnelle de la protéine.

4.4 Comportement des simulations de dynamique mo-