• Aucun résultat trouvé

Modélisation de l’espace conformationnel

Les protéines sont des objets flexibles, constamment en mouvement et explorant un espace continu de conformations. Cette flexibilité jouant un rôle important dans les processus biolo- giques et leur régulation, elle devrait être prise en compte lors de l’exploration des séquences. Malheureusement, cet espace conformationnel est trop vaste pour pouvoir être modélisé dans son intégralité. et doit donc être simplifié. Cette simplification peut se faire en discrétisant l’espace des conformations du squelette de la protéine mais également en discrétisant celui des chaines latérales. De plus, afin d’évaluer la stabilité des séquences générées, les programmes de CPD estiment la différence d’énergie libre entre les états replié et déplié de la protéine. L’état déplié n’ayant pas de structure définie, il faut développer un modèle simplifié permet- tant d’évaluer son énergie. Dans cette partie, nous nous intéressons aux différentes méthodes utilisées pour décrire l’espace conformationnel des protéines dans leurs états replié et déplié.

2.1.1 Modélisation de l’état replié

2.1.1.1 Modélisation des chaines latérales

Dans l’état replié, les chaines latérales des acides aminés adoptent préférentiellement un petit ensemble de conformations (Finkelstein & Ptitsyn [1977] ; Janin et al. [1978] ; Ponder & Richards [1987]). Ces conformations, énergétiquement favorables, sont appelées rotamères et permettent de représenter l’espace des conformations de chaque type d’acide aminé de manière discrète. Chaque rotamère est ainsi décrit par des valeurs d’angles de torsions particulières (figure 2.1). Les rotamères sont regroupés au sein de bibliothèques construites à partir d’études statistiques des structures de protéines connues. Ces bibliothèques ont été développées selon différents critères. Elles peuvent être indépendantes du squelette de la protéine (Tuffery et al. [1991] ; De Maeyer et al. [1997]), dépendantes des angles φ et ψ (Dunbrack & Karplus [1993] ; Dunbrack & Cohen [1997] ; Towse et al. [2016]) ou dépendantes des structures secondaires α ou β (Schrauber et al. [1993] ; Lovell et al. [2000]). Certains modèles utilisent également des rotamères continus. Dans ce cas, chaque rotamère peut explorer une partie de l’espace des angles χ (Gainza et al. [2012]).

2.1. Modélisation de l’espace conformationnel

A

B

Figure 2.1 – Angles χ d’une arginine (A) et exemples de rotamères associés (B). 2.1.1.2 Modélisation du squelette

Dans la plupart des programmes de CPD le squelette de la protéine est fixe. Les atomes

C, N, Cα et O du squelette ainsi que l’atome Cβ sont maintenus rigides. Cette méthode pré-

sente quelques limites. En effet, il arrive que certaines chaines latérales soient énergétiquement défavorables alors qu’un léger ajustement du squelette suffirait à diminuer considérablement leur énergie. Ce type de limitation a notamment été démontré par les travaux sur le dessin du cœur du lysozyme T4 par Hurley et al. [1992], Baldwin et al. [1993] et Mooers et al. [2003].

Introduire de la flexibilité au niveau du squelette augmente considérablement l’espace conformationnel. Néanmoins cette flexibilité permet de décrire de manière plus juste la protéine et peut donc améliorer la qualité des séquences produites. Nous présentons ici quelques-unes des approches utilisées pour augmenter l’espace conformationnel du squelette.

Desjarlais & Handel [1995] ont modélisé la flexibilité du squelette à l’aide d’une méthode d’exploration de séquences Monte Carlo couplée à un algorithme génétique permettant d’op- timiser la structure de la protéine. Cette approche a permis de modifier jusqu’à huit positions du cœur hydrophobe de la protéine 434 cro. Une seconde étude a montré que l’ajout de flexi- bilité dans le squelette n’améliorait pas les résultats de prédictions de stabilité (Desjarlais & Handel [1999]). Ce résultat peut s’expliquer par le fait que le cœur des protéines est une région géométriquement très contrainte, avec peu de degrés de liberté.

Su & Mayo [1997], en se basant sur les travaux de Harbury et al. [1995] et Offer & Ses- sions [1995], abordèrent le problème en traitant les structures secondaires comme des corps rigides capables d’adopter des positions différentes les uns par rapport aux autres. Jusqu’à six positions du cœur de la protéine Gβ1 ont été redessinées avec cette méthode.

Harbury et al. [1998] se sont intéressés aux protéines présentant une symétrie telles que les

équations paramétriques. Cette méthode fût utilisée pour modéliser une famille non naturelle de structures de type right-handed coiled-coil. Elle n’est cependant pas applicable à la majorité des protéines, puisque la plupart ne possèdent pas de symétrie.

Le groupe de Baker proposa une méthode consistant à échantillonner alternativement l’es- pace des séquences et des structures. Les séquences sont d’abord optimisées pour un squelette fixe, puis la conformation du squelette est optimisée à séquence fixe (Saunders & Baker [2005]). Grâce à cette méthode,Kuhlman et al. [2003] ont créé un nouveau pli protéique, validé par la suite expérimentalement.

Une autre approche développée par Smith & Kortemme [2008] consiste à appliquer un mouvement dit de backrub au squelette de la protéine. Ce mouvement correspond au déplace-

ment de l’atome Cαi d’un résidu i ainsi que sa chaine latérale autour d’un axe formé par les

atomes Cαi−1 et Cαi+1. Cette approche a été utilisée par Georgiev et al. [2008] pour redessiner

deux protéines (GrsA-PheA et Gβ1). Les auteurs ont montré que l’utilisation du mouvement

backrub permet d’explorer des séquences de plus basses énergies.

Récemment, Druart et al. [2016] ont développé une méthode qui prend en compte la flexi- bilité de certaines régions de la protéine. Pour cela, une petite bibliothèque de squelettes est d’abord produite par dynamique moléculaire. Une simulation Monte Carlo hybride explore en- suite à la fois l’espace des conformations des chaines latérales et du squelette. Cette approche a été appliquée au design d’une boucle flexible située dans le site actif de la tyrosyl-ARNt synthétase.

2.1.2 Modélisation de l’état déplié

La stabilité d’une protéine dépend de la différence d’énergie libre entre son état déplié et son état replié. Afin de calculer la stabilité des séquences produites par CPD il est donc nécessaire de modéliser l’état déplié de la protéine. Cet état est extrêmement difficile à modéliser puisqu’il est peu structuré et correspond à une distribution continue de conformations ou micro-états d’énergies similaires.

En supposant que l’énergie de repliement ne dépend que de la séquence en acides aminés, on peut cependant décrire cet état de manière implicite. Une possibilité est de maintenir fixe la composition en acides aminés ou bien la proportion hydrophile-hydrophobe. De cette manière l’état déplié devient équivalent pour toutes les séquences et n’entre plus en jeu lors de la