• Aucun résultat trouvé

Discussion et conclusions

variance des positions montre principalement des lignes horizontales et verticales sans motifs diagonaux. Il ne semble donc pas y avoir de couplage fort entre les quatre positions mutées ce qui est cohérent avec les données expérimentales.

3.6 Discussion et conclusions

Dans ce chapitre nous avons optimisé les paramètres du modèle déplié pour redessiner les séquences des domaines PDZ. Les énergies de référence ont été ajustées pour reproduire les compositions expérimentales de deux domaines PDZ, Tiam1 et Cask, et de leurs homo- logues proches. L’approche utilisée présente deux nouveautés, en séparant les positions en deux groupes distincts (exposé/enfoui), et en effectuant l’optimisation des énergies de référence par groupes et non plus par types.

L’utilisation de ces paramètres pour le dessin complet des domaines PDZ de Tiam1 et Cask donne des performances similaires au programme Rosetta. Malgré ces bons résultats, le modèle présente encore quelques limites. Certaines ne sont pas intrinsèques au programme Proteus et concernent la plupart des programmes de CPD. La première provient de l’utilisation de la stabilité comme critère de sélection. En effet, bien que cette information soit importante, elle n’est pas la seule à prendre en compte lors de la modification de séquences. D’autres informations comme la spécificité du repliement (Mach & Koehl [2013]), la protection contre l’agrégation ou la prise en compte d’informations fonctionnelles sont également importantes. Il est néanmoins intéressant de noter que parmi les séquences produites par Proteus et Ro- setta, aucune n’a été classée dans une autre superfamille par Superfamily. Cela suggère que les séquences produites sont spécifiques au repliement des domaines PDZ. Il est également possible de prendre en compte des informations fonctionnelles, telle que la liaison de ligand, en conservant les types natifs aux positions impliquées dans l’interface de liaison par exemple. Une seconde limitation du modèle provient de l’utilisation d’un squelette fixe. Bien que les atomes du squelette ne soient pas autorisés à bouger lors de l’exploration Monte Carlo, la flexibilité du squelette est traitée de manière implicite par l’utilisation d’une constante diélec- trique pour le soluté supérieure à 1. Les valeurs de 4 et 8 permettent en effet de modéliser les réarrangements du squelette et des chaines latérales en réponse à une mutation ou un change- ment de rotamère. Malgré cette flexibilité implicite, le modèle ne permet pas au squelette de modifier sa structure tridimensionnelle suite à une répulsion stérique par exemple. La rigidité

du squelette pourrait en partie expliquer la faible diversité observée dans le cœur hydrophobe des séquences produites. Cette diversité est augmentée lorsque les séquences obtenues sur les squelettes de Tiam1 et Cask sont regroupées. En effet, la validation croisée a montré que le jeu de paramètres était sensible au squelette utilisé, et ce malgré la proximité structurale entre Tiam1, Cask, DLG2 et la Synténine.

Enfin, bien que les fréquences des différents groupes soient respectées, la composition des différents types ne l’est pas parfaitement et certains acides aminés sont sur-représentés quand d’autres sont sous-représentés. Ce déséquilibre pourrait nuire à la qualité des séquences pro- duites en rendant certains types trop rares. Ces disparités nous ont déjà amené à scinder certains groupes pour rééquilibrer les fréquences. Une autre possibilité serait de retirer les contraintes au sein d’un groupe dans les derniers pas de l’optimisation ou d’effectuer l’optimi- sation sur un plus petit nombre de positions, qui seraient donc plus contraintes géométrique- ment.

L’application du modèle pour redessiner quatre positions impliquées dans la spécificité de Tiam1 et Tiam2 a donné des résultats encourageants. En effet, les simulations ont produits des séquences cohérentes avec les séquences naturelles et notamment la séquence sauvage ou des homologues proches. La qualité des prédictions reste toutefois assez sensible au squelette utilisé puisque ce dernier a tendance à introduire un biais vers sa séquence native. L’utilisation d’un squelette fixe limite également les séquences explorées. L’introduction de la flexibilité au cours de l’exploration permettrait donc probablement d’améliorer la qualité des résultats.

Les simulations ont toutefois permis d’estimer de manière qualitative les changements d’af- finité liés aux différentes mutations et ce en très bon accord avec les données expérimentales. La seule limitation de cette approche est la nécessité d’échantillonner les séquences (ou des séquences homologues) dans les états apo et holo. Lorsque ces données sont disponibles, cette approche peut permettre d’estimer de manière simple et à grande échelle l’affinité de com- plexes protéine:ligand. Elle peut donc constituer une première étape dans l’identification de mutations d’intérêt pour améliorer l’affinité ou modifier la spécificité de la protéine cible.

Chapitre 4

Étude de la stabilité des séquences

générées par Proteus à partir du

squelette du domaine PDZ de Tiam1

Au chapitre précédent nous avons optimisé les énergies de référence du programme Proteus pour modéliser des séquences compatibles avec le repliement des domaines PDZ. Les para- mètres optimisés nous ont permis de produire des séquences similaires à celles des domaines PDZ retrouvés dans le base de donnée Pfam. Bien que ces résultats soient encourageants, le modèle présente plusieurs limites dont l’utilisation d’un squelette fixe et d’un solvant implicite. Une étape de validation supplémentaire consiste à tester la stabilité des séquences Proteus par simulations de dynamique moléculaire en solvant explicite. Ce test, bien plus strict que les précédents, permet de vérifier la compatibilité de la séquence avec le squelette de la protéine. Dans ce chapitre nous décrirons les différentes étapes allant de la sélection des séquences Proteus à étudier jusqu’aux simulations de ces dernières afin d’analyser leur stabilité. Enfin, pour cinq des séquences, des tests in vitro ont été effectués par l’équipe de E. Fuentes (Univer- sité de l’Iowa, USA) pour confirmer les résultats des simulations et proposer des modifications pouvant améliorer la stabilité de nos séquences. Nous verrons qu’une des séquences Proteus

et trois de ses variants se replient bien à environ 50◦C.

4.1 Génération des séquences

La première étape consiste à générer des séquences et des structures compatibles avec le repliement du domaine PDZ de Tiam1 en utilisant les jeux de paramètres optimisés.

4.1.1 Conservation des résidus de l’interface protéine-peptide

Le but final de cette étude est de synthétiser puis de tester in vitro le repliement des séquences sélectionnées pour valider notre modèle. En prévision de ces tests, nous avons fait le choix de contraindre 11 positions de l’interface protéine-peptide (figure 4.1). L’avantage de conserver cette interface est double. Cela permettra d’abord de tester indirectement le repliement du domaine par des mesures d’affinité. En effet, si la protéine est capable de lier le peptide Sdc1, il y a de fortes chances qu’elle soit repliée correctement. D’autre part, les études par résonance magnétique nucléaire (RMN) de Tiam1 en solution ont montré que la liaison du peptide permettait de stabiliser le domaine. Dans le cas où la séquence se replie mais serait peu stable, l’ajout d’un peptide pourrait augmenter sa stabilité et donc permettre d’effectuer les analyses expérimentales.

Le choix des résidus à contraindre a été effectué en se basant sur les positions conservées dans l’alignement Pfam, les données bibliographiques et la structure du complexe Tiam1:Sdc1.

La position P0 du peptide est l’une des plus importantes. Elle est reconnue au niveau d’une

poche, appelée S0, fortement hydrophobe dans le cas de Tiam1, formée par les résidus Y858,

F860, L915 et L920. Il semble donc important de conserver ces résidus. K850 est également important car il interagit avec l’extrémité C-terminale du peptide par l’intermédiaire d’une molécule d’eau (Shepherd et al. [2010] ; Pedersen et al. [2016]). T857 forme une liaison hy-

drogène avec le groupement carboxylate du peptide. Au niveau de la position P−1, Shepherd

et al. [2011] ont montré que S861 interagissait avec la chaine latérale de Y1. La poche S−2,

formée par les résidus L911 et K912 est impliquée dans la reconnaissance de la position P−2

et doit donc être conservée. Enfin, les derniers résidus sélectionnés sont S908 et N876 qui in-

teragissent respectivement avec les positions P−4 et P−6. S908 fait une liaison hydrogène avec

E4 en cours de la simulation et N876 est très conservée dans l’alignement Pfam et forme une liaison hydrogène avec K6 (Liu et al. [2013]).

4.1.2 Jeux d’énergies de référence utilisés

La valeur de la constante diélectrique du soluté, P, modifie sensiblement la composition

des résidus du cœur. Nous avons donc décidé de générer des séquences à partir des deux jeux

4.2. Sélection des séquences