• Aucun résultat trouvé

1.3 Modèles mécanistiques

2.1.2 Espace des structures

L'espace des structures peut être décrit de diérentes manières. La première est de discrétiser l'espace et de créer des modèles de treillis, notamment utilisés dans le cadre de démonstrations théoriques. Une autre méthode de description de structures peut être de créer un ensemble de structures réelles, censé représenter l'ensemble total des structures. Cet ensemble peut représenter des structures extrêmement détaillées ("tous-atomes") ou bien représenter simplement le repliement de la structure, selon l'utilisation à laquelle est voué cet ensemble de structures. Par la suite, nous considèrerons que l'espace des protéines

peut être décrit de manière discrète (soit par les modèles de treillis, soit par les ensembles de structures)21.

2.1.2.1 Modèles de treillis

Historiquement, la première méthode de description de l'espace des structures consiste à créer un modèle de treillis (lattice model). Il s'agit de transformer l'espace réel, cartésien, en un espace discret à deux ou trois dimensions : il existe des treillis carrés [Thomas and Dill, 1996a], cubiques [Yue et al., 1995] mais aussi hexagonaux [Gibbons et al., 2004]. Bien que ce soit une méthode qui simplie énormément l'espace des structures, il permet de décrire d'une manière exhaustive toutes les structures possibles pour une même séquence. Pour illustrer les méthodes de treillis, j'ai représenté dans la gure 2.2 un treillis cubique de taille 43 dans lequel est monté une séquence hypothétique de taille n = 23.

Figure 2.2  Exemple d'un treillis cubique (43) sur lequel est montée une séquence hypothé-

tique de taille n = 23.

Comme il s'agit d'un espace discret, il est possible de faire l'inventaire exhaustif de toutes les structures possibles (dans ce treillis) de cette séquence de taille 23. Cependant, si l'espace des structures C est dénombrable dans un tel système, il devient dicilement calculable lorsqu'on augmente la taille de la séquence. En ce qui concerne l'exemple pré- senté dans la gure 2.2, le véritable ensemble des structures possibles pour cette séquence ne se réduit pas à un espace de taille 43 mais demande un espace de description bien

plus grand (inclus dans l'espace de taille 233). En pratique, on peut réduire l'espace des 21. Il existe une dualité dans la manière de décrire l'espace des structures, car celui-ci peut être considéré d'une manière discrète ou d'une manière continue. Cependant, un espace continu étant inadapté pour notre contexte, nous n'en parlerons pas ici.

2.1. Introduction structures décrites dans un modèle de treillis en ne visitant que des espaces restreints autour de la conformation native de la protéine [Chiu and Goldstein, 1998b].

De tels modèles de treillis sont cependant problématiques car ils représentent une simplication à l'extrême des structures de protéines. En général, un treillis ne décrit pas des structures réellement existantes, puisqu'il réduit un espace cartésien réel en un espace discret.Cependant, ils sont très utiles dans un cadre théorique, an par exemple de démontrer la validité d'une approche [Thomas and Dill, 1996b]. An de représenter des structures plus réelles que celles créées par les modèles de treillis, une méthode est de faire appel à jeux de structures de protéines réelles.

2.1.2.2 Jeux de structures (decoys)

On peut opposer deux buts diérents lorsqu'on construit un jeu de structures. D'un côté, on peut chercher à retrouver le repliement d'une protéine, et on cherchera alors à construire un ensemble de repliements qui soit le plus large possible, en utilisant une re- présentation simpliée (coarse-grained). Ce repliement représente une structure générale, qui peut être utilisé par diérentes familles de protéines. D'un autre côté, on peut chercher à retrouver la conformation exacte d'une protéine, jusqu'aux conformations rotamériques des acides aminés et l'on préfèrera alors construire un jeu de structures qui soient proches de la structure cible, en faisant appel à une description extrêmement précise des acides aminés et des atomes constituant la protéine.

Une méthode intuitive pour construire un jeu de structures explorant un large éventail de possibles, est de se baser sur les repliements de protéines existantes. Avec la production intensive de données moléculaires, qui ont eu lieu ces dernières années, on peut supposer que la Protein Data Bank (PDB) représente un ensemble exhaustif des repliements pos- sibles. A partir d'une base de données de protéines naturelles, on peut donc construire un jeu de structures représentant la population de toutes les structures possibles (biolo- giquement), par threading [Jones et al., 1992a].

Le threading consiste à forcer le repliement de la séquence (ici la séquence native) sur un jeu de structures (généralement issue de la PDB). On peut distinguer deux types de threading : le gapless threading qui permet de produire des structures sans incohérence au sein de la structure (g. 2.3 à gauche), et le gapped threading qui produit des structures articielles (et donc permet aussi de produire des structures chimériques) en reliant des parties de protéines entre elles (g. 2.3 à droite). Pour réaliser des structures leurres sans incohérence dans la structure tridimensionnelle, il faut tout d'abord choisir une protéine pthr dont la séquence est de taille supérieure ou égale à celle de la séquence cible (soit

a) b)

Figure 2.3  Threading [Finkelstein et al., 1995a]. a) création d'un couple structure/séquence sans incohérence structurale, b) création d'un couple structure/séquence avec des incohérences structurales, les diérentes parties de la nouvelle structure étant reliées par les pointillés rouges.

nthr≥ n). Ensuite, il faut choisir aléatoirement une position i au sein de la protéine pthr,

telle que i < nthr − n. Cette position i et les n − 1 suivantes formeront une nouvelle

structure dans la banque de structures threading.

An de réaliser du gapped threading, il faut déterminer les diérents segments, dans la protéine, qui formeront la nouvelle structure leurre, puis les relier articiellement. Cette méthode permet de visiter de manière aléatoire tous types de structures et de structures secondaires, alors que la méthode du gapless threading permet d'obtenir des structures cohérentes, et surtout des relations entre les diérents sites qui sont consistantes avec la biologie. Par exemple, le gapped threading pourrait couper la structure à un mauvais endroit, et placer deux structures incompatibles côte à côte. D'un autre côté, ce gapped threading permet notamment de faire des déplacements de structures secondaires : on peut par exemple prendre un feuillet β d'une longueur l et l'échanger avec une hélice α de même longueur.

Les jeux de structures créées par threading permettent de couvrir un grand nombre de structures possibles, mais également biologiquement plausibles (puisque issues de la PDB). On peut supposer qu'ainsi on peut couvrir quasiment tout l'espace des structures autorisées, ce qui permet d'obtenir l'énergie moyenne de la séquence repliée dans des structures alternatives (cf. g. 2.1).

D'un autre côté, on peut construire un jeu de structures an qu'elles soient les plus proches possibles de la structure native. Pour cela, on peut par exemple, à partir de la structure native, utiliser des programmes de dynamique moléculaire, pour déplacer les angles de torsion dans la structure [Rajgaria et al., 2008] et former ainsi une nouvelle

2.2. Quelle forme d'énergie ?