• Aucun résultat trouvé

Les protéines THAP ont été découvertes au sein de l’Institut de Pharmacologie et de Biologie Structurale dans l’équipe de Biologie Vasculaire du Dr. Jean Philippe GIRARD. C’est une nouvelle famille de protéines cellulaires est conservée au sein de l’évolution puisque l’on retrouve ces protéines chez les invertébrés et les vertébrés et plus de 100 protéines THAP ont été identifiées (Roussigne et al., 2003b, Clouaire et al., 2005). Ces protéines sont absentes chez les procaryotes, les plantes, les levures et les champignons et semblent donc restreintes au règne animal.

Cette nouvelle famille de protéines THAP est caractérisée par la présence d’un ou plusieurs domaines THAP, un petit motif d’environ 90 acides aminés retrouvé en position amino-terminale dans la majorité de ces protéines (Roussigne et al., 2003b). L’analyse des séquences primaires des domaines THAP fait apparaître des positions strictement conservées parmi lesquelles trois cystéines et une histidine qui forment une signature C2CH définissant le motif THAP : Cys-X2-4-Cys-X35-50-Cys-X2-His.

Outre cette signature C2CH, quatre autres positions sont strictement conservées, la proline 26, le tryptophane 36, la phénylalanine 58 et la proline 78 faisant partie de la boîte C-terminale AVPTIF (Figure 37) qui présente aussi un bon niveau de conservation (Roussigne et al., 2003b).

Des homologies de séquence entre le domaine THAP et le domaine de liaison à l’ADN séquence spécifique de la transposase de l’élément P chez Drosophila melanogaster (sixième séquence sur l’alignement Figure 37A) ont été mises en évidence. La transposase de l’élément P chez la drosophile reconnaît l’ADN de façon spécifique, en utilisant un domaine THAP présent dans sa partie N-terminale, et va permettre d’intégrer l’élément P dans le génome. Cette protéine catalyse donc la réaction de transposition d’un élément mobile qui contient le gène codant pour cette même transposase, il s’agit d’un élément génétique mobile. Il semble donc que le domaine THAP résulte de la domestication d’un élément génétique mobile. Ce n’est pas la première fois que l’on observe la domestication d’un élément mobile puisque le domaine « BED finger », un domaine à coordination au zinc atypique, présente lui aussi une homologie de séquence avec la transposase « Hobo-like » retrouvée chez les animaux, les plantes et les champignons (Smit and Riggs, 1996). Le domaine THAP de la transposase de l’élément P de Drosophilia melanogaster reconnaît de façon spécifique une cible

ADN consensus de 10 bp (5’-ATA/CCACTTA-3’) et des expériences de mutagénèse dirigée ont montré que la signature C2CH et la boîte AVPTIF sont des éléments essentiels pour l’activité de liaison à l’ADN (Lee et al., 1998). Chez l’homme, la protéine THAP9 présente 25% d’identité de séquence (sur 500 acides aminés) avec la transposase de l’élément P de Drosophila melanogaster soulignant ainsi le lien à travers l’évolution entre ces deux protéines. Il apparaît donc que la domestication de l’élément P a permis l’acquisition d’un nouveau module de liaison à l’ADN séquence spécifique, le domaine THAP, par de nouvelles protéines cellulaires, les protéines THAP (Roussigne et al., 2003b).

La famille des protéines THAP humaines est constituée de 12 protéines nucléaires (hTHAP0- 11) de tailles différentes allant de 213 à 903 acides aminés. Elles présentent dans leur partie N- terminale un domaine THAP portant la signature C2CH, le motif AVPTIF et un autre domaine de type « coiled coil » souvent retrouvé dans la partie C-terminale de ces protéines (Figure 38A).

Figure 38 : La famille des protéines THAP humaines.

(A) Représentation schématique des 12 protéines THAP humaines, le domaine THAP est coloré en bleu et le domaine « coiled coil » en noir. (B) Alignement de séquences primaires des domaines THAP humains.

Nous avons vu que, de part leurs relations évolutives avec la transposase de l’élément P de

Drosophila melanogaster, les protéines THAP humaines sont des facteurs nucléaires issus de la

domestication d’un élément génétique mobile. Chacune de ces protéines présentant un domaine THAP homologue au domaine de liaison à l’ADN séquence spécifique de cette transposase, il paraît donc très probable que la fonction de liaison à l’ADN séquence spécifique du domaine THAP a été conservée au cours de l’évolution. Sur le plan de la séquence primaire, le domaine THAP présente une signature C2CH typique d’un module de coordination au zinc. Le domaine THAP pourrait donc être associé à un domaine de coordination du zinc présentant une activité de liaison à l’ADN séquence spécifique. Dans le but de tester ces hypothèses, la protéine hTHAP1 a été choisie comme prototype de la famille des protéines THAP et son domaine THAP a été caractérisé biochimiquement. Dans un premier temps, l’activité de liaison à l’ADN de la protéine hTHAP1 et, plus particulièrement de son domaine THAP, incluant les 90 premiers acides aminés de la protéine hTHAP1, a été testée. La technique de SELEX (Selective Evolution of Ligands by EXponential enrichment) (Bouvet, 2001) a été choisie pour mettre en évidence l’activité de liaison à l’ADN du domaine THAP de hTHAP1 mais aussi la cible ADN consensus reconnue. En utilisant ce type d’approche, il a été montré que le domaine THAP de hTHAP1 est un domaine de liaison à l’ADN séquence spécifique qui reconnaît une cible ADN consensus de 11 paires de bases appelée THABS (THAp Binding Site) (Clouaire et al., 2005) (Figure 39A). Le motif THABS est un motif bipartite constitué d’un motif GGCA et d’une thymine placée trois paires de bases en amont (du coté 5’). La spécificité de reconnaissance de l’ADN du domaine THAP de THAP1 a été testée par gel retard, en compétition avec une sonde froide, mais aussi en faisant varier certaines positions dans la sonde ADN utilisée (Figure 39B). Ainsi, l’intégrité du motif GGCA apparaît essentielle pour l’activité de liaison à l’ADN du domaine THAP de THAP1. De même, la thymine en position 3 est essentielle pour que l’interaction spécifique se mette en place (Figure 39C). En ce qui concerne le domaine THAP de hTHAP1, il a été montré par mutagénèse dirigée que la signature C2CH et les quatre autres résidus strictement conservés sont essentiels pour le maintien de l’activité de liaison à l’ADN séquence spécifique (Figure 39D). De plus, des expériences de gel retard réalisées en présence d’un agent chélateur spécifique du zinc (1,10-o-phenanthroline) ont mis en évidence que le zinc est essentiel à l’activité de liaison à l’ADN séquence spécifique du domaine THAP de hTHAP1 (Figure 39D). Le domaine THAP de THAP1 apparaît donc comme un domaine de liaison à l’ADN séquence spécifique dépendant du zinc faisant partie de la superfamille des motifs « doigts de zinc ».

Figure 39 : Caractérisation de l’activité de liaison à l’ADN séquence spécifique du domaine THAP de la protéine hTHAP1.

(A) Séquence consensus THABS issue de l’expérience de SELEX réalisée avec le domaine THAP de hTHAP1. (B) Gel retard montrant l’interaction spécifique entre le domaine THAP de hTHAP1 et la cible THABS, des expériences de compétition confirment la spécificité d’interaction. (C) Gel retard réalisé avec le domaine THAP de hTHAP1 et différentes cibles ADN dérivant du motif THABS, ces expériences montrent l’importance relative des différentes positions de la cible THABS. (D) Gel retard montrant l’importance des résidus conservés du domaine THAP pour la mise en place de la reconnaissance spécifique de la cible THABS. Les résidus de la signature C2CH et les quatre résidus strictement conservés dans les domaines THAP ont été mutés en alanine et l’activité de liaison spécifique de l’ADN a été testée. Au centre, un gel retard réalisé en présence d’un chélateur spécifique du zinc (1,10-o-phenanthroline) montre l’importance du zinc pour l’activité de liaison spécifique de l’ADN du domaine THAP de THAP1. (Clouaire et al., 2005).

Cependant, le domaine THAP semble être un domaine à doigt de zinc atypique. En effet, le domaine à doigt de zinc classique de type C2H2, le plus abondant dans le génome humain, est un petit domaine de 30 acides aminés répété en multiple copies. De même, la partie impliquée dans la coordination du zinc dans les facteurs GATA ne comprend que 30 acides aminés sur les 60 que compte ce type de domaine de liaison à l’ADN. Le domaine THAP est beaucoup plus grand puisqu’il compte environ 90 acides aminés, mais la principale caractéristique de ce domaine est la longue insertion (qui peut aller jusqu’à 53 acides aminés) présente entre les deux paires de ligands du zinc. Outre cette originalité structurale, il reconnaît une longue cible ADN (10-11 paires de bases). Toutes ces caractéristiques font du motif THAP un nouveau domaine de coordination au zinc à activité de liaison séquence spécifique de l’ADN. D’autre part, plus de 100 protéines THAP ont été identifiées : le domaine THAP est ainsi le deuxième domaine de coordination au zinc le plus abondant après le motif en doigt de zinc classique de type C2H2. La caractérisation de son repliement et de son interaction avec l’ADN est donc essentielle pour comprendre comment ce nouveau type de doigt de zinc reconnaît spécifiquement sa cible ADN.

III-2- Caractérisation fonctionnelle des protéines THAP