• Aucun résultat trouvé

robustesse aux mutations dans le phénomène évolutif. Cet effet a été nommé survival of the flattest, par opposition au classique survival of the fittest, par Wilke [193]. Il engendre aussi un comportement adaptatif que Wilke a appelé neutral staircase [194].

Évolution des structures Il est également possible d’envisager l’évolution des structures. Un déterminant essentiel semble être la « modifiabilité » qui est le nombre de séquences compatibles avec une certaine conformation [180]. L’estimation de la modifiabilité pré- sente un enjeu de taille dans le protein design [204] : une structure très modifiable est plus robuste aux mutations en moyenne et plus stable. England et Shakhnovich ont pu ca- ractériser structuralement la modifiabilité [49]. Par cette méthode, il purent prouver que les structures hautement modifiables étaient plus fréquentes dans les organismes thermo- philes [48] (une forte sélection des séquences est observée expérimentalement [90]).

I.5 Champ du travail

Notre objectif est de concevoir un modèle d’évolution incluant une contrainte fonc- tionnelle fondée sur l’interaction protéine-protéine. La prise en compte d’un modèle plus satisfaisant de la fonctionnalité est une sophistication récente. Mais les méthodes propo- sées jusqu’à présent ne nous semblent pas suffisantes. Blackburne et Hirst ont travaillé sur les poches hydrophobes d’un modèle HP sur réseau carré et tétraédrique [12, 82]. Ils ont construit des « paysages fonctionnels ». De manière assez similaire, des modèles de liaison à des ligands ont vu le jour [196]. Ces ajouts ne modifient pas singulièrement le schéma qui émerge des critères de stabilité structurale ou de l’efficacité du repliement. En particulier, la disparité des modifiabilités [196] et les structures de superfunnel persistent dans ces modèles [14].

L’intégration d’un critère fonctionnel n’est cependant pas complètement résolue. Par exemple, l’apparition d’une fonction n’est pas traitée. L’interaction protéine-protéine est une approche qui permet de tenter de répondre à cette question. Bien que l’interaction entre protéines soit peu éloignée des modèles de ligand, dans notre travail, le ligand est une protéine qui est, elle aussi, capable d’évoluer.

L’interaction protéine-protéine n’est pas une seule préoccupation de l’évolution in si- lico, à cause de son rôle ubiquitaire dans le fonctionnement de la cellule [62]. En évolution classique, l’émergence de systèmes d’interaction est également une question complexe en suspens. Dans les perspectives de son article Selectionism and neutralism in molecular evo- lution, Nei reconnaît l’importance de ces sujets d’investigation :

However, the interaction of transcription factors and protein-coding genes or protein-protein interaction is quite complex. Therefore, the study of evolution

of complex phenotypic characters would not be easy. Yet, this is one of the most important problems in evolutionary biology at present [142].

Dans leur revue, Chan et Bornberg-Bauer discutent cette approche, d’un point de vue computationnel :

The most widely used among the criteria are based either on (1) native struc- ture, (2) foldability or (3) native thermodynamic stability. More complex fitness criteria that might, in a sense, be more relevant ot biological function would require more complicated setups, such as taking into account multiple chain interactions. Consideration of such criteria would likely lead to big increases in the number of model parameters and computational intensity [32, p. 127].

Contrairement au contenu de la citation précédente, la prise en compte de l’interac- tion protéine-protéine ne demande pas l’addition de nombreux paramètres. Certes, des approximations sont nécessaires. Nous nous limitons aux dimères à trois états : les parte- naires du complexe doivent se replier avant d’entreprendre de s’associer. Par conséquent, l’étude que nous allons proposer repose sur un travail préalable des protéines monomé- riques. Les avantages de cette méthode sont, premièrement, un coût de calcul compatible avec les ressources des ordinateurs disponibles et deuxièmement qu’il est possible de pré- senter dans ce modèle comment une structure s’accomode d’une contrainte structurale.

Nous proposons un modèle de protéine sur réseau et un autre de protéine tridimen- sionnelle hors-réseau. L’étude des protéines monomériques tridimensionnelles permet de confirmer l’existence de la structure de superfunnel en utilisant un modèle plus réaliste, sur la route from lattice to all-atom models [132].

Le nombre de paramètres n’est pas rédhibitoire, comme l’ont pensé initialement Chan et Borberg-Bauer. Nous verrons que seule une constante γ, rendant compte de la pénalité entropique qui incombe aux protéines interagissant, est requise pour modéliser la diméri- sation de protéines sur réseau. Un modèle tridimensionnel est proposé plus tard. Dans ce cas, c’est le rang du dimère natif, par ordre d’énergie croissante, qui suffit à estimer l’effica- cité de l’association.

Par l’étude de l’interaction protéine-protéine, nous introduisons un autre ingrédient largement étudié en génétique des populations mais jusqu’alors ignoré dans ce type de si- mulation : les relations épistatiques entre gènes. Pour l’instant, il n’existe pas de modèle physique de l’évolution de tels systèmes d’interaction. Nous verrons que l’interaction épi- statique accentue les effets de dynamique des populations.

Le réseau neutre résultant de la contrainte protéine-protéine maintient une structure de superfunnel. Nous trouvons que la capacité à dimériser est augmentée sous l’action de l’évolution neutre. Cette observation est symptomatique d’une structure de « superfunnel fonctionnel » : les séquences dimérisant efficacement sont au centre du réseau neutre dans la région fortement connectée du réseau.

Chapitre II

Modèle et méthodes

The ways in which mutations become advantageous are so opportu- nistic that it is not easy to find simple rules to describe them.

Kimura, The neutral theory of molecular evolution

II.1 Introduction

Le modèle d’interaction entre deux protéines que nous développerons dans des cha- pitres ultérieurs seront bâtis sur les réseaux neutres monomériques de ces protéines. Ce chapitre introduit les modèles et les outils nécessaires à l’étude des monomères. Comme cela a été dit dans l’introduction, les simulations d’évolution in silico nécessitent un mo- dèle structural et fonctionnel qui fournit le support de l’évolution, le réseau neutre, et un modèle évolutif qui décrit la dynamique d’une population évoluant sur ce réseau.

L’évolution est supposée neutre et s’applique, à une population haploïde : une séquence doit se replier dans une conformation donnée pour assurer la survie de l’individu qui en est porteur. Nous dirons que la séquence est « viable ». L’ensemble des séquences viables connectées par des mutations ponctuelles forment un réseau neutre. Nous définirons pré- cisément les règles décrivant itérativement comment évolue une population infinie sur ce réseau. Ces règles sont inspirées de travaux antérieurs [21, 44, 184, 203]. Nous démontre- rons que ces règles assurent une convergence vers un état stationnaire déterminé unique-

ment par la topologie du réseau neutre. La preuve de la convergence requiert l’introduction préliminaire de quelques outils issus de la théorie des graphes.

Les réseaux neutres seront construits à partir de deux modèles de protéine. Dans les deux modèles, les séquences viables sont celles qui se replient dans une conformation cible avec une stabilité suffisante.

Nous présenterons un modèle de protéine sur réseau bidimensionnel utilisé à diverses reprises par différents auteurs [112,172,173,195,203]. Nous utiliserons plusieurs modèles inspirés du modèle HP [38]. Afin d’atteindre des complexités raisonnables, le modèle HP considère seulement deux catégories d’acides aminés : les acides aminés hydrophobes (H) et les acides aminés hydrophiles (P).

Nous détaillerons également un modèle de protéine tridimensionnelle très similaire à celui de Bastolla et al. [7]. À cet effet, le squelette peptidique de trois protéines sera utilisé. Les trois protéines en question sont le trp-cage (1L2Y), le domaine SH3 de Vav et le domaine SH3 de Grb2 (chaînes B et C de 1GCQ). La résolution de ce modèle est à l’échelle du résidu d’acide aminé et le potentiel énergétique est un potentiel d’interaction entre les paires d’acides aminés en contact. La capacité d’une séquence à se replier dans la conformation cible sera évaluée à l’aide d’un jeu de conformations mimant les états dénaturés de la séquence. Les séquences viables seront ensuite converties en « profils » à partir desquels seront bâtis les réseaux neutres.

Documents relatifs