• Aucun résultat trouvé

Les protéines à motifs répétés de type HEAT forment une famille de protéines présentes aussi bien chez les eucaryotes que les procaryotes. La plupart de ces protéines sont impliquées dans des interactions protéines-protéines bien que des enzymes soient également présentes (une enzyme particulière de cette famille sera abordée en conclusion de cette thèse). Le nom « HEAT » provient de quatre protéines de cette famille : la Huntingtine, le facteur d’élongation « Elongated factor 3 », la « protein phosphatase 2A », et la kinase TOR (« Target Of Rapamycin »). Le motif est constitué de deux hélices antiparallèles d’une taille allant de 37 à 47 résidus. La divergence entre les protéines de cette famille est telle qu’il est encore possible de les classer dans trois sous- groupes. Cette divergence est problématique pour la création d’un motif consensus : il faut être prudent dans le choix des protéines utilisées dans l’alignement de séquences car l’utilisation de protéines trop éloignées risque fausser l’alignement et proposer des acides aminés incompatibles et délétères pour la stabilité de la structure. Le sous-groupe des protéines de type « PBS HEAT repeats » a donc été utilisé, nommé d’après la Phycobilin

Synthase accessory protein, première protéine identifiée appartenant à ce sous-groupe.

Ces protéines sont constituées de motifs de longueur et séquence homogène, facilitant la création d’un consensus. Elles sont également très présentes chez les organismes thermophiles, signe de leur stabilité. La protéine Mth187, dont la structure a été publiée en 2006 185 (code PDB : 1TE4) a été le point de départ de la création du consensus utilisé

106

Figure 78 : Protéine Mth187 de M. thermoautotrophicum, de type PDB HEAT repeat, a été le point de départ de la création du motif consensus des αReps. Les motifs bleu et mauve sont des motifs internes tandis que le motif rouge est un « cap » C-terminal.

Cette protéine de M. thermoautotrophicum est composée de trois motifs de type HEAT repeat, dont deux motifs dit « internes » et un motif « cap » C-terminal de séquence clairement divergente. La portion N-terminale est constituée d’une boucle désordonnée. Une recherche BLAST effectuée sur la base des deux premiers motifs a permis de trouver les homologues les plus proches et de créer un premier consensus. Une seconde recherche sur la base de ce consensus a permis d’obtenir 500 séquences issues de 100 protéines différentes. 184 La représentation en logo-séquence permet de visualiser le

107

Figure 79 : A. Représentation en logo séquence de l'alignement des homologues du motif de Mth187. La taille des lettres représente la conservation de ces acides aminés à ces positions du motif. B. Structure d’un motif de la banque αRep créée sur la base du motif consensus. En sphères grises sont les acides aminés hydrophobes responsables du maintien de la structure et en bâtons bleus sont les acides aminés variables, tous sur la même face du motif. C. Structure de deux motifs internes (l’un en gis clair, l’autre en gris foncé). En bleu sont représentés les deux acides aminés arginine et aspartate établissant deux liaisons hydrogene entre deux motifs successifs. Ce réseau de liaisons hydrogènes et la continuité du cœur hydrophobe contribuent à la stabilité de l’ensemble de la protéine. D. Structure cristallographique d’une protéine αRep à quatre motifs internes, la surface variable est colorisée en orange. On remarque que le motif C-cap (à droite) est constant.

108

Le consensus obtenu est donc GDERAVEPLIKALKDEDXXVRXXAAXALGXI, où les X représentent les positions variables qui sont donc modifiées aléatoirement au sein de la bibliothèque αRep. La variabilité des acides aminés à ces positions n’a pas été faite de manière totalement aléatoire (par l’utilisation de codons NNK par exemple). Il a fallu en effet respecter les biais en acides aminés propres à chaque position (figure 80), comme la nécessité d’acides aminés de petite taille (sérine et alanine) en position 23 ou encore l’absence de proline à certaines positions. D’autres biais viennent de considérations pratiques telles que le choix d’éviter la présence de cystéines ou la nécessité d’avoir des codons en position 30 compatibles avec un site de restriction BsmBI utilisé lors de la création de la banque. Concernant les modules N- et C-terminaux, le motif en partie N- terminale est basé sur une protéine possédant un consensus très proche de Mth187 et possédant un motif N-terminal de 34 résidus exposé au solvant (protéine A0B7C6_METTP). Les positions de ce N-cap correspondant aux positions variables ont été également randomisées. Le motif en partie C-terminale correspond exactement à celui de la protéine Mth187, sans résidus randomisés.

Figure 80 : Schéma de randomisation propre à chaque position variable de la banque αRep. La première colonne indique la position, la deuxième indique les codons utilisés (avec leur proportion relative entre parenthèses) et la troisième indique les acides aminés codés par chaque codon. La distribution des acides aminés provenant de clones choisis aléatoirement dans la banque correspond à celle encodée dans ce tableau (selon 184).

La création des banques αRep tire plein avantage du caractère répété de ces protéines. Elles sont créées par polymérisation de micro-gènes dégénérés. La méthode d’amplification circulaire de l’ADN utilisée (RCA pour « rolling circle amplification »), couplée à la polymérisation orientée (grâce à l’utilisation de l’enzyme de restriction BsmBI) puis à la ligation intramoléculaire des plasmides créés permet d’obtenir de très grandes efficacités de clonage et donc des banques de très grande taille (figure 81).184

109

Figure 81 : Méthode de création des banques αRep. Les microgènes dégénérés (codant chacun pour un motif différent) sont amplifiés par la méthode RCA. Ils sont ensuite digérés selon un site de restriction asymétrique grâce à l’enzyme BsmBI. Les microgènes sont ensuite polymérisés dans le vecteur accepteur, la polymérisation étant arrêtée par un ajout d’une grande quantité du microgène N-cap. Les plasmides sont enfin refermés par le site unique BspMI, cette ligation intramoléculaire est bien plus efficace que la ligation d’un insert dans un vecteur accepteur (selon

184)

Une première banque, appelée αRep-1.0 contenant 3.108 clones indépendants a été

construite sur la base de ces considérations, selon un schéma de dégénérescence aux positions hypervariables conduisant à un enrichissement en acides aminés aromatiques.184 Une banque optimisée de seconde génération contenant 2.109 clones

indépendants a ensuite été construite186. Dans cette banque appelée αRep-2.1, le nombre

de séquences non codantes induites par des mésappariements survenus lors de la construction de la banque a été minimisé et la variabilité des acides aminés aux positions variables mime la diversité naturelle des protéines de cette sous-famille de motifs HEAT. L’étude de plusieurs protéines issues de ces deux banques contenant un nombre variable de motifs internes, a permis de montrer que les protéines obtenues grâce à cette analyse de séquences peuvent être produites chez E. coli en grande quantité (plusieurs dizaine de milligrammes pas litre de culture), sous forme soluble et repliée. Des expériences de

110

dénaturation ont permis de constater que leur résistance à la chaleur croissait effectivement avec le nombre de motifs internes, une protéine contenant quatre motifs internes possédant une température de demi-dénaturation de 80°C contre 71°C pour une protéine contenant un seul motif interne, et 95°C pour une protéine avec 6 motifs internes. 184

La structure αRep, une architecture de choix pour la conception de