• Aucun résultat trouvé

Aux diverses séquences cis-régulatrices décrites précédemment viennent se fixer des protéines régulatrices [98]. Ces protéines, communément appelées facteurs de transcription, agissent en général en stimulant la transcription des gènes eucaryotes, mais il existe aussi des facteurs qui la répriment. Les facteurs de transcription liés aux promoteurs proximal et distal régissent l’assemblage du complexe d’amorçage ainsi que la fréquence à laquelle l’ARN polymérase II en place dans ce complexe amorce la transcription. Quand, par exemple, on forme in vitro un complexe d’amorçage avec un facteur TFIID dépourvu de ses protomères TAF, la transcription effectuée par ce complexe n’est pas stimulée par les activateurs transcriptionnels fixés sur le promoteur proximal ; ceci démontre que la commande de la transcription exige absolument les protomères TAF (Figure 14) [378].

Les facteurs de transcription reconnaissent leurs sites spécifiques grâce à de petits domaines, très justement appelés domaines de liaison à l’ADN, et coopèrent avec d’autres protéines pour stimuler ou réprimer la transcription par l’intermédiaire d’un domaine effecteur ou domaine de trans-activation (Figure 14). Dans la plupart des cas, ces domaines sont interchangeables entre plusieurs protéines ce qui leur donne la caractéristique d’être des unités indépendantes [160]. Différents groupes de facteurs de transcription ont été identifiés

sur la base de la séquence de leurs domaines caractéristiques ainsi que sur leur structure tridimensionnelle et leur façon d’interagir avec l’ADN [160, 293, 369, 392].

Figure 14. Vue simplifiée de l’interaction entre un facteur de transcription et le complexe de pré-initiation.

L’ARN polymérase II (en rouge) a besoin des facteurs généraux de la transcription (TFII) D, A, B, F, E et H (en bleu) pour reconnaître le site d’initiation de la transcription via la boîte TATA (ou d’autres séquences) dans le promoteur proximal. Tous ces facteurs, regroupés sous le terme de complexe de pré-initiation, sont nécessaires pour la transcription basale. Les facteurs de transcription (en vert) se fixent sur des séquences spécifiques situées dans le promoteur grâce à leur domaine de liaison à l’ADN (DBD) et module le niveau de transcription grâce à leur domaine de trans-activation (TAD) qui interagit avec le complexe de pré-initiation. Image tirée de l’article de B. Ganss & A. Jheon [130].

Les domaines des facteurs que je vais décrire par la suite, se replient de façon à présenter une protubérance ou une structure flexible, voire les deux, qui entrera en contact avec l’ADN. Ces facteurs montrent des structures très diversifiées permettant le plus souvent l’insertion d’une hélice α dans le grand sillon. Les interactions avec les atomes du squelette sucre-phosphate de l’ADN (liaisons hydrogène et interactions de van der Waals) sont essentielles pour que les domaines se positionnent correctement [160].

Voici une classification des facteurs de transcription selon ce que Stephen C. Harrison a publié en 1991 [160] et selon la base de données dédiée aux facteurs de transcription eucaryotes et à leurs éléments de régulation : TRANSFAC® [209, 356, 404]. Quelques exemples de facteurs dont la structure tridimensionnelle a été déterminée vont être montrés, correspondant en particulier à des facteurs nucléaires recherchés chez Plasmodium.

a. Protéines à domaine basique

Le domaine basique de ces protéines, long de 15 à 30 acides aminés, correspond au domaine de liaison à l’ADN proprement dit. Ces protéines appartiennent à différents sous-groupes définis grâce à la structure du domaine qui leur permet de se dimériser. Parmi ces sous-groupes se trouvent notamment les protéines portant une agrafe à leucines (bZIP) [218] ainsi que les protéines à motif hélice-boucle-hélice (bHLH) [267]. Ces protéines ont un rôle important dans la différenciation et le développement. Elles sont aussi intéressantes car elles illustrent parfaitement le rôle important que la formation d’un hétérodimère peut jouer dans la régulation de l’expression des gènes.

Protéines avec une agrafe à leucines (bZIP) (Figure 15a)

Le motif « agrafe à leucines » (leucine zipper en anglais) a été le premier motif conservé dans plusieurs facteurs de transcription eucaryotes à être découvert et aujourd’hui, ce motif apparaît dans une large variété de facteurs de transcription, allant des levures à l’homme [201]. D’une longueur de 30 à 40 résidus, il se situe tout de suite en aval du domaine basique et est caractérisé par une répétition de sept leucines [218].

Les protéines de cette classe peuvent former des homodimères ou des hétérodimères grâce au motif agrafe à leucines et la nature du dimère influe sur l’activité biologique des protéines. Par exemple, le facteur de transcription activateur AP-1 est formé d’une protéine c-Fos et d’une protéine c-Jun [74] ; alors que l’activité du facteur CREB est inhibée lorsqu’il est complexé avec le facteur CREM [122]. Les hétérodimères peuvent aussi acquérir de nouvelles spécificités de liaison à l’ADN et ainsi se fixer à des séquences ADN différentes de celles sur lesquelles se fixent les homodimères [253]. Néanmoins, il apparaît que ces protéines ne forment pas des homodimères très stables et qu’un partenaire convenable est essentiel pour l’hétérodimérisation et la liaison à l’ADN [201].

Protéines à motif hélice-boucle-hélice (bHLH) (Figure 15b)

Les protéines à motif hélice-boucle-hélice [267] ont des similitudes avec la famille présentée précédemment dans le sens où la région basique se fixant à l’ADN est suivie d’une autre région permettant la formation de dimères [387]. C’est cette dernière région qui a

donné son nom à cette classe de protéines car elle est formée d’une hélice α amphipathique 5, d’une boucle puis d’une autre hélice α amphipathique [267].

Tout comme les protéines présentant une agrafe à leucines, les protéines hélice-boucle-hélice ont d’importants rôles dans la différenciation et le développement et leur activité est modulée par la formation d’hétérodimères mélangeant des activateurs, des protéines ubiquitaires et des répresseurs [20].

Figure 15. Protéines ayant un domaine basique comme domaine de liaison à l’ADN.

Chaque structure est montrée sous deux angles différents. Tous ces facteurs de transcription sont composés de deux domaines : un domaine de liaison à l’ADN et un domaine qui leur permet de se dimériser. Le domaine basique (en vert) est, pour toutes ces structures, le domaine qui se lie à l’ADN (en indigo). Les protéines se distinguent donc par leur domaine de dimérisation : soit un domaine agrafe à leucines (en rouge et jaune), soit un motif hélice-boucle-hélice (en rose foncé et clair), soit les deux. (a) Le facteur AP-1 humain est un hétérodimère formé de la protéine Jun (en jaune et vert) et de la protéine Fos (en rouge et vert). Sur les domaines agrafe à leucines sont matérialisées en orange les chaînes latérales des leucines importantes pour la dimérisation. (b) Le facteur MyoD de souris s’homodimérise pour se lier à l’ADN. (c) Le facteur de transcription formé des protéines Myc (en jaune, rose foncé et vert) et Max (en rouge, rose clair et vert clair) s’hétérodimérise grâce au motif hélice-boucle-hélice et aux domaines agrafe à leucines. Sur les domaines agrafe à leucines sont matérialisées en orange les chaînes latérales des leucines importantes pour la dimérisation. Les fichiers PDB utilisés pour faire ces images sont les suivants : (a) 1FOS [142], (b) 1MDY [244], (c) 1NKP [269].

Protéines à motif hélice-boucle-hélice et à agrafe à leucines (bHLH-ZIP) (Figure 15c) Les protéines à motif hélice-boucle-hélice et agrafe à leucines sont ce que l’on pourrait considérer comme une chimère des deux précédents types de protéines. Le domaine de liaison à l’ADN qui reste une région basique est suivi par un motif hélice-boucle-hélice puis par une agrafe à leucines. La dimérisation se fait à la fois par les domaines en hélice-boucle-hélice et par les domaines en agrafe à leucines. La fonction des hétérodimères formés par des protéines à motif bHLH-ZIP dépend de la nature des protomères : l’hétérodimère formé par les protéines Myc et Max a un potentiel oncogénique fort, tandis que l’hétérodimère Mad-Max agit en tant que répresseur transcriptionnel [175].

b. Protéines à motif en doigt de zinc (Zn finger)

Les motifs en doigt de zinc (Figure 16) sont d’autres motifs structuraux majeurs impliqués dans les interactions ADN-protéine [27, 193]. Les protéines comportant un motif en doigt de zinc sont impliquées dans plusieurs aspects de la régulation des gènes eucaryotes : la différenciation et la croissance, les proto-oncogènes, les facteurs généraux de la transcription, etc. [26, 27, 207]. Au départ, on pensait que toutes les protéines de cette famille présentaient le même schéma, à savoir des répétitions en tandem du motif en doigt de zinc, chacun comprenant la séquence suivante : Tyr/Phe-X-Cys-X2 ou 4-Cys-X12-His-X3-5-His (X pour n’importe quel acide aminé). Or il s’est avéré que cette séquence représentait une sous-classe des protéines à motif en doigt de zinc, la sous-classe Cys2His2 ou C2H2. Aujourd’hui, on connaît d’autres sous-classes comme, par exemple, la sous-classe Cys4 qui regroupe des protéines régulatrices du type récepteur d’hormones ou la sous-classe Cys6 qui rassemble des régulateurs métaboliques.

Le doigt de zinc C2H2 est un site de liaison compact de 25-30 résidus. Il est composé d’une boucle β et d’une hélice α qui sont « pelotonnées » l’une contre l’autre grâce à un ion Zn2+ en liaison avec deux cystéines de la boucle β et deux histidines de l’hélice α [369]. Bien que souvent associé aux facteurs de transcription se fixant sur le promoteur distal, le motif en doigt de zinc peut aussi se fixer au niveau du promoteur proximal, ce qui est le cas pour les facteurs Sp1 (Figure 16a) [41] et YY1 (Figure 16b) [384, 385].

Figure 16. Protéines ayant un motif en doigt de zinc dans leur domaine de liaison à l’ADN.

Le motif en doigt de zinc est composé d’une boucle β lovée contre une hélice α. Un ion Zn2+ (en rouge) maintient la structure en interagissant avec les chaînes latérales de deux cystéines de la boucle (en jaune) et de deux histidines de l’hélice (en orange). (a) Deuxième et troisième domaines en doigt de zinc de la protéine Sp1 humaine (respectivement à gauche et à droite). Les liaisons entre l’atome de zinc et les chaînes latérales de deux cystéines (en jaune) et de deux histidines (en orange) sont indiquées par des pointillés. (b) Le facteur YY1 humain comporte quatre domaines en doigt de zinc qui s’enroulent autour de l’ADN (en indigo) en suivant le grand sillon. Les fichiers PDB utilisés pour faire ces images sont les suivants : (a) 1SP2 et 1SP1 [274], (b) 1UBD [173].

c. Protéines à motif hélice-tour-hélice (HTH)

La structure en motif hélice-tour-hélice a d’abord été découvert chez les procaryotes puis chez les eucaryotes [161], et aujourd’hui de nombreuses structures HTH ont été déterminées que ce soit pour des protéines seules ou des protéines complexées avec un ADN [293]. Dans sa forme la plus simple, le motif HTH a une longueur d’environ 20 résidus et est constitué, comme son nom l’indique, de deux hélices α quasiment perpendiculaires connectées par un tour de 4 résidus [210], la deuxième hélice étant celle qui se loge dans le grand sillon et crée des interactions spécifiques avec l’ADN [160, 161]. Des variations du domaine de liaison HTH classique ont été découvertes ces dernières années au niveau du tour entre les deux hélices : en effet, celui-ci peut être plus long et ainsi adopter une conformation différente. Le nombre de résidus insérés dans le tour est assez variable, allant de un seul chez le proto-oncogène c-myb [284] à 21 chez le facteur de transcription hépatocytaire LFB1/HNF1 [116].

Des résidus hydrophobes conservés dans les hélices ainsi qu’une glycine dans le tour participent à la stabilisation de l’arrangement entre les deux hélices et permettent à la structure HTH de rester compacte par rapport au reste de la protéine [293]. Cependant, le motif HTH ne peut se replier ou fonctionner tout seul : ce n’est qu’une partie d’un domaine de liaison à l’ADN plus grand qui peut présenter un environnement structural différent d’une protéine à l’autre [363]. C’est ainsi que les protéines contenant un motif HTH peuvent être classifiées en plusieurs groupes structuraux selon la nature et la position des autres éléments structuraux (hélices α, brins β ou structures en épingle à cheveux) qui forment avec le motif HTH le cœur hydrophobe des protéines [161]. Voici deux de ces groupes.

Figure 17. Protéines ayant un domaine de liaison à l’ADN à motif hélice-tour-hélice.

(a) Trois vues du domaine de liaison à l’ADN de la protéine E2F4 humaine. Les différents constituants du motif à hélices ailées sont représentés en couleur ivoire (pour les hélices α), en jaune (pour les brins β) et en rouge (pour les ailes). Pour plus de clarté, la protéine DP-2, qui forme un hétérodimère avec E2F4, n’a pas été représentée. (b) Deux vues de l’homéodomaine du facteur Engrailed de la drosophile fixé à une séquence d’ADN (en indigo). Les structures composant l’homéodomaine sont différenciées grâce aux couleurs : saumon pour les hélices α et blanc pour les tours. Les fichiers PDB utilisés pour faire ces images sont les suivants : (a) 1CF7 [417] et (b) 3HDD [124].

Les protéines à « hélices ailées » (Figure 17a)

Le facteur HNF-3 fut le premier facteur comportant des hélices ailées à être découvert en 1993 [61]. Au niveau topologique, le motif à hélices ailées est une structure α/β compacte

composée de deux ailes (A1 et A2), 3 hélices α (H1, H2 et H3) et trois brins β (B1, B2 et B3) arrangés de la manière suivante : H1-B1-H2-H3-B2-A1-B3-A2 [129]. Les protéines à hélices ailées diffèrent du modèle canonique des protéines HTH par la longueur du « tour » situé entre les hélices H2 et H3.

Comme les autres facteurs de transcription, ils peuvent agir seul ou sous forme de dimères. En effet, on retrouve ce motif dans les facteurs de transcription de la famille E2F qui contrôle les gènes impliqués dans la croissance et la réplication de l’ADN [346]. La liaison à l’ADN des protéines E2F est augmentée quand celles-ci se dimérisent avec des membres de la famille DP, eux-mêmes étant des facteurs à hélices ailées [417].

Les protéines présentant un homéodomaine (Figure 17b)

L’homéodomaine est un motif de liaison à l’ADN présent dans une grande famille de régulateurs eucaryotes [137, 340]. Même si les séquences conservées ont été identifiées au début dans des protéines régulant le développement chez la drosophile, aujourd’hui on sait que l’homéodomaine a un rôle plus général dans la régulation des gènes chez les eucaryotes. En clonant et en séquençant des gènes homéotiques de la drosophile très bien connus (antennapedia, ultrabithorax, engrailed, fushi tarazu), on remarqua que les protéines comportaient la même région de 60 acides aminés bien conservés. Contrairement à une structure HTH seule, ces 60 résidus, qui prirent le nom d’homéoboîte ou homéodomaine, forment une structure repliée stable, composée de trois hélices α – les deux premières sont empaquetées l’une contre l’autre de manière anti-parallèle alors que la troisième est à peu près perpendiculaire aux deux autres – et surtout capable de se fixer à l’ADN par elle-même [2].

d. Les protéines à architecture β en contact avec le petit sillon

Il est difficile de trouver une caractéristique commune aux domaines de liaison à l’ADN de cette classe de facteurs de transcription. Par exemple, les domaines de liaison à l’ADN des facteurs de transcription HMGB ne contiennent que des hélices alors que ceux des protéines composant le facteur NF-κB (Figure 18a) ou encore ceux de la protéine p53 (Figure 18b) ou de la TBP (Figure 18c) contiennent des hélices α et des brins β. Les protéines HMGB et la TBP

se retrouvent ensemble dans cette classe à cause leur mode d’interaction avec l’ADN : une insertion dans le petit sillon qui entraîne une vrille prononcée de la double hélice [356].

Figure 18. Protéines à architecture β en contact avec le petit sillon.

Les structures sont représentées selon le même mode : les hélices α en rouge, les brins β en jaune et l’ADN en indigo. (a) Homodimère de la protéine NF-κB p52 humaine. (b) Suppresseur de tumeur p53.

(c) TATA-binding protein. Les fichiers PDB utilisés pour faire ces images sont les suivants : (a) 1A3Q [71], (b) 1TUP [59] et (c) 1CDW [279].

III.4 - Modèle de mécanisme d’activation de la transcription spécifique d’un gène