• Aucun résultat trouvé

Une culture de parasites a été traitée avec un double brin d’ARN de façon à inhiber la protéine PfMyb1 dans les parasites. Grâce à la puce à ADN du laboratoire ciblée sur le cycle cellulaire, la transduction du signal et la régulation de la transcription, les conséquences de cette inhibition sur l’expression de certains gènes ont pu être étudiées (Article 4). Il en ressort que huit gènes sont exprimés différemment (Tableau 8) : sept sont sous-exprimés (MAL6P1.248, MAL6P1.249, PF14_0224, PFI1105w, PFL1285c, PFL1885c, PFL2345c) et un seul est surexprimé (MAL13P1.279) (Figure 5, p. 35 de l’Article 4).

Tableau 8. Liste des gènes exprimés différemment lorsque la culture de parasites est traitée par un ARN double brin pfmyb1.

La colonne ‘RI indique la longueur de la région intergénique propre à chaque gène. Les signes ’-‘ et ‘+’ indique si les gènes ont été sous-exprimés ou surexprimés suite au traitement de la culture.

Comme les gènes ont vu leur profil d’expression changer à cause de l’inhibition du facteur PfMyb1, les éléments de régulation de type myb ont été recherchés dans les promoteurs de ces gènes. Ces éléments de régulation ont été identifiés dans sept des huit promoteurs : seul le promoteur du gène codant la phosphoglycérate kinase (PFI1105w) ne possède pas de site de fixation canonique pour la protéine PfMyb1.

En plus des sites de fixation de la protéine Myb, des motifs partagés par ces huit régions intergéniques ont été recherchés. Quatre motifs ont été mis en évidence sur les promoteurs de ces gènes, par les différents programmes utilisés (Figure 27). Tous ces motifs ont en commun d’avoir principalement des guanines à des positions non ambiguës.

Les motifs 1 et 2 sont retrouvés dans les promoteurs de tous les gènes impliqués dans l’étude. Le motif 1 est représenté de manière assez homogène dans tous les promoteurs avec en moyenne 3,95 motifs pour 1 000 pb. Le motif 2, quant à lui, est représenté différemment selon les séquences : environ 3,6 fois pour 1 000 pb dans les promoteurs PFL1285c, PFI1105w, PFL2345c et PF14_0224 et MAL13P1.279) et environ 5,6 fois pour 1 000 pb dans les promoteurs MAL6P1.248, MAL6P1.249 et PFL1885c. Ces deux motifs sont surreprésentés par rapport à ce qui a été identifié dans des séquences aléatoires (respectivement 0,5 motif pour 1 000 pb et 2,15 motifs pour 1 000 pb). Mais ils sont sous-représentés par rapport aux résultats obtenus avec le groupe de promoteurs pris au hasard (respectivement 4,10 motifs pour 1 000 pb et 4,88 motifs pour 1 000 pb) et encore plus par rapport à ceux obtenus avec les séquences codantes (respectivement 7,18 motifs pour 1 000 pb et 6,69 motifs pour 1 000 pb).

Les deux autres motifs sont plus rares et ne sont pas présents dans toutes les séquences. Mais il semblerait qu’ils n’apparaissent pas au hasard. En effet, dans les séquences aléatoires, ces deux motifs n’apparaissent jamais.

Le motif 3 est identifié dans la moitié des promoteurs : dans les promoteurs PFL1885c et PFL1285c, il apparaît moins d’une fois pour 1 000 pb alors que dans les promoteurs PFI1105w et MAL13P1.279, il apparaît respectivement 2,6 et 2,8 fois pour 1 000 pb. Ce motif est aussi retrouvé dans la moitié des promoteurs choisis au hasard et la moitié des séquences codantes avec des moyennes équivalentes dans les trois groupes de séquences (entre 0,7 et 0,8).

Le motif 4 est absent des promoteurs PFL2345c et PF14_0224 et présent moins d’une fois pour 1 000 pb dans les autres séquences. Ce motif est quasiment absent des promoteurs pris au hasard et des séquences codantes car il est identifié respectivement dans deux et trois séquences uniquement.

Figure 27. Quatre motifs sont partagés par les promoteurs des gènes dont l’expression est altérée quand le facteur de transcription PfMyb1 est inhibé.

(a) Consensus des quatre motifs identifiés par les programmes AlignACE et GIBBS Motif Sampler. A chaque position se trouvent les nucléotides possibles, une position vide indique que les quatre nucléotides sont acceptés. (b) Répartition des quatre motifs dans les promoteurs gouvernant les gènes dont l’expression a été modifiée à cause de l’inhibition du facteur PfMyb1. Les traits situés au dessus indiquent les motifs situés sur le brin codant et les traits en dessous, les motifs sur le brin complémentaire. En bleu ciel, l’élément de régulation de type myb ; en bleu, le motif 1 [ag][acgt][ag]GG[acgt]A ; en noir, le motif 2 [ag]TG[acgt]G[acgt] ; en rouge, le motif 3 GGGG[gt][ag] et en vert, le motif 4 GG[agt]G[agt][acgt]A[acgt]G. Les traits représentant les motifs 1, 3 et 4 ont été agrémentés d’un point de couleur pour faciliter la lecture de la figure.

Les gènes cibles de PfMyb1 sont exprimés différemment lorsque le facteur de transcription est inhibé : le gène MAL13P1.279 est surexprimé alors que les sept autres gènes sont sous-exprimés. Dans ces résultats, rien ne peut expliquer cette différence d’expression. Il n’existe aucun motif mis en évidence ici qui serait présent dans les promoteurs des sept gènes sous-exprimés et absent dans le promoteur du gène MAL13P1.279 ou présent dans les huit promoteurs mais dans des proportions différentes.

III - Discussion et perspectives

Plasmodium est un organisme tout à fait particulier car c’est l’organisme qui possède le génome le plus riche en A+T des organismes connus aujourd’hui (80,6% en moyenne). Cette richesse en A+T n’est pas répartie aléatoirement dans le génome. En effet, les régions non codantes, c’est-à-dire les introns et les régions intergéniques, peuvent posséder jusqu’à 90% de A+T. L’étude des promoteurs est donc rendue difficile par ce biais de composition.

Comme chez les autres eucaryotes, les promoteurs de P. falciparum possèdent une structure bipartite, à savoir un promoteur proximal qui permet la fixation de la machinerie basale de transcription et qui est donc responsable de l’initiation de la transcription contrôlée en amont par des éléments de régulation sur lesquels viennent se fixer un jeu précis de facteurs de transcription.

Il aurait été intéressant de pouvoir prédire la position des sites d’initiation de la transcription dans les promoteurs pour positionner le promoteur proximal et la région 5’UTR. Il existe aujourd’hui différents programmes permettant de prédire les sites d’initiation de la transcription par l’analyse de la position des différents éléments constitutifs les uns par rapport aux autres. Malheureusement ces différents programmes ne sont pas du tout adaptés pour un génome aussi particulier que celui de P. falciparum. De plus, au jour d’aujourd’hui, il existe trop peu de données biologiques caractérisant les promoteurs proximaux de P. falciparum pour élaborer un modèle de prédiction des sites d’initiation de la transcription adapté au génome du parasite.

Comme deux TBP ont été annotées et étudiées dans le parasite en 1993 et 1994 [165, 256] et que nous avons prédit la présence d’un facteur NF-Y se fixant à la boite CCAAT dans P. falciparum (p. 147), il était intéressant d’analyser les séquences correspondant à ces deux types de facteurs dans les régions intergéniques de Plasmodium. La richesse en A+T laissait présager la présence de nombreuses boîtes TATA. En effet, les boîtes TATA sont présentes dans 99% des régions intergéniques du parasite à une fréquence moyenne de 10-11 boîtes pour 1 000 pb. Chez les eucaryotes, la boîte TATA est souvent précédée d’une boîte GC, sur laquelle se fixe la protéine Sp1, et d’une boîte CCAAT, site de fixation du facteur hétérotrimérique NF-Y entre autres. Chez Plasmodium, la boîte GC est inexistante si on utilise

pour la recherche le consensus eucaryote GGGGCGGGG[ct], ce qui n’est pas étonnant quand on sait que les séquences sont composées à 90% de A+T. Quant à la boîte CCAAT, elle n’existe que dans 5% des régions intergéniques, si on utilise, encore une fois, le consensus eucaryote [agc][agt]CCAAT[cg][ag] pour la recherche.

Parmi les promoteurs possédant une boîte TATA et une boîte CCAAT, seules 121 séquences présentent le schéma habituel des promoteurs proximaux des eucaryotes, à savoir une boîte TATA précédée d’une boîte CCAAT à 100 nucléotides maximum. Cependant les modules sont positionnés « au hasard » dans les régions intergéniques (données non montrées) : il semble donc impossible d’utiliser ces modules pour tenter de définir la zone du promoteur proximal. De plus, parmi ces 121 promoteurs, on ne trouve aucun des promoteurs pour lesquels le site d’initiation de la transcription a été identifié par diverses techniques biologiques (Tableau 4).

Qu’il s’agisse de la boîte TATA, de la boîte CCAAT ou de l’association des deux boîtes, il ne semble pas exister de différences entre les régions intergéniques vraies et des séquences aléatoires ayant la même composition en bases. Il est donc difficile de faire la différence entre une vraie boîte (CCAAT ou TATA) fonctionnelle et une conséquence du biais de composition. Ceci est renforcé par le fait que ces éléments et modules de régulation sont représentés différemment dans les séquences codantes qui ont u pourcentage en A+T inférieur : il y a moins de boîtes TATA, plus de boîtes CCAAT et de modules CCAAT-TATA.

Parmi tous les facteurs impliqués dans la régulation transcriptionnelle que nous avons annotés, PfMyb1 est le seul des facteurs présentés dans ce mémoire qui se fixe sur un élément de régulation précis. Et c’est le facteur que nous avons le plus étudié dans notre groupe. Comme ses homologues eucaryotes, PfMyb1 reconnaît et se fixe sur une séquence d’ADN correspondant au consensus [ct]AAC[acgt]G[act][act]. L’élément de régulation de type myb est présent dans la moitié des séquences intergéniques à une fréquence moyenne de moins d’un site pour 1 000 pb, ce qui est nettement inférieur à ce que l’on rencontre dans des séquences aléatoires riches en A+T et les séquences codantes. La présence de cet élément de régulation ne semble donc pas être le fruit du hasard et pourrait avoir une signification biologique.

En plus des éléments de régulation connus chez les eucaryotes, il semble logique de penser que P. falciparum a développé des éléments de régulation spécifiques adaptés au biais de composition. Deux groupes de promoteurs ont été utilisés pour essayer de mettre en évidence des éléments de régulation spécifiques de Plasmodium.

Le premier groupe est composé de 37 promoteurs gouvernant des gènes présentant un même profil d’expression, celui de pfmyb1 (Tableau 7) : ils devraient logiquement subir la même régulation. Dans ce premier groupe, deux motifs ont été mis en évidence (Figure 26a). Ces deux motifs semblent être spécifiques de P. falciparum car ils sont quasiment inexistants dans des séquences aléatoires ayant la même composition en A+T que les régions intergéniques. De plus, même si ces motifs sont aussi présents dans les séquences codantes, leur représentation est différente : la moyenne est de 1 motif pour 1 000 pb dans les régions intergéniques et de 0,75 motif pour 1 000 pb dans les séquences codantes.

Le deuxième groupe est composé de promoteurs dont les gènes ont un profil d’expression altéré lorsque l’on inhibe l’ARNm pfmyb1 et donc la production du facteur de transcription PfMyb1 (Tableau 8) : on peut donc penser que ces promoteurs sont notamment sous le contrôle, direct ou indirect, de la protéine PfMyb1. En effet, des expériences d’immunoprécipitation de la chromatine (voir Figure 7, p. 36 de l’Article 4) ont montré qu’il existait une interaction ex vivo entre PfMyb1 et les promoteurs de six des gènes dont le profil d’expression est altéré : MAL13P1.279, PFL1285c, PF14_0224, MAL6P1.248, MAL6P12249 et PFI1105w (alors que ce dernier ne semble pas posséder d’élément de régulation de type myb). L’interaction n’a pas pu être démontrée avec les deux autres promoteurs (PFL1885c et PFL2345c) et cela peut s’expliquer par les limites de la technique d’immunoprécipitation de la chromatine : soit l’interaction entre PfMyb1 et son site de liaison était trop faible pour être détectée, soit l’élément de régulation de type myb du promoteur était inaccessible dans la chromatine. Mais il se peut aussi que ces gènes soient sous le contrôle d’un facteur de transcription, lui-même sous le contrôle de PfMyb1 mais dont le gène n’est pas présent sur la puce à ADN thématique utilisée lors de cette expérience.

Quatre motifs ont été mis en évidence dans ces promoteurs : les deux premiers sont partagés par tous les promoteurs, les deux autres sont présents dans au moins la moitié des promoteurs. Il existe une différence de représentation entre ces quatre motifs : les motifs 1 et

2 sont très fortement représentés par rapport aux motifs 3 et 4 (3,95 et 4,37 motifs pour 1 000 pb contre 0,84 et 0,46 motifs pour 1 000 pb). Cependant, chacun de ces motifs semble avoir une signification biologique car ils sont surreprésentés par rapport à ce que l’on rencontre dans des séquences aléatoires, les motifs 3 et 4 n’existant pas du tout dans les séquences aléatoires. De plus, ces motifs ne sont pas représentés de la même manière dans les séquences codantes à cause de la différence de composition en A+T qui existe entre les séquences codantes et les séquences non codantes.

Le motif 2 identifié dans le premier groupe (Figure 26a) et le motif 3 identifié dans le deuxième groupe (Figure 27a) sont assez similaires car composés d’une suite de quatre guanines et peuvent en fait correspondre au même motif. Comme ce motif a été identifié dans les deux groupes de promoteurs ainsi que dans des promoteurs pris au hasard dans le génome, peut-être s’agit-il d’un élément de régulation constitutif qui remplacerait, chez Plasmodium, la boîte GC des autres eucaryotes ? Un motif hybride GGGG[agt][agt] a été recherché dans tous les promoteurs de P. falciparum : 6 456 motifs ont été identifiés dans 2613 séquences soit ~50% des séquences. Ce motif est quasiment inexistant dans les séquences aléatoires (507 motifs répartis dans 378 séquences) alors qu’il est très représenté dans les séquences codantes (9 626 motifs répartis dans 3 067 séquences).

Pour savoir si les motifs identifiés comme spécifiques de P. falciparum sont fonctionnels, c’est-à-dire s’ils permettent à un facteur de transcription de se fixer pour participer à la modulation de la transcription, il est nécessaire de valider les études in silico par des expériences biologiques.

Tout d’abord, il faudra commencer par faire des retardements sur gel pour savoir si une protéine ou un complexe protéique peut se fixer sur un oligonucléotide correspondant à l’élément de régulation d’intérêt. S’il y a interaction entre l’oligonucléotide et une protéine ou un complexe protéique, il sera alors indispensable d’identifier le facteur de transcription ou le complexe protéique grâce à une colonne d’affinité et de la spectrométrie de masse.

La fonctionnalité de l’élément de régulation sera ensuite étudiée grâce à la transfection d’un vecteur dans les parasites. Le vecteur sera constitué d’un gène rapporteur dont l’expression sera gouvernée par tout ou une partie du promoteur. Il sera alors nécessaire de

construire toute une série de vecteurs dans lesquels l’élément de régulation potentiel aura été muté, délété partiellement ou totalement ou encore déplacé par rapport au gène rapporteur. La comparaison du niveau d’expression du gène rapporteur dans ces différents vecteurs permettra de définir la ou les séquences et les bases directement impliquées dans le régulation et un éventuel effet de position.

L’identification d’éléments de régulation spécifiques de P. falciparum permettra ainsi d’identifier des facteurs de transcription spécifiques du parasite qui ne sont pas identifiables par homologie de séquences puisqu’ils n’existent pas chez les autres eucaryotes.

LES FACTEURS DE LA

Différents facteurs de transcription ont été recherchés dans le génome de Plasmodium falciparum, avant que celui-ci soit entièrement séquencé, c’est-à-dire avant octobre 2002.

Les facteurs recherchés ont été choisis dans la liste des facteurs donnée par la base de données TRANSFAC® [255, 404]. Notre choix s’est porté principalement sur des facteurs connus pour être impliqués dans la régulation du cycle cellulaire, du développement et de la différenciation. Néanmoins, d’autres facteurs ont été recherchés car ils étaient des coups de cœur, c’est-à-dire des facteurs sur lesquels nous avions travaillé avant ce projet ou parce qu’ils interagissaient avec un des facteurs de notre intérêt. Parmi tous les facteurs recherchés, certains ont donné de très bons résultats, alors que d’autres n’ont à ce jour toujours pas été identifiés dans le génome de Plasmodium falciparum avec les programmes utilisés à ce jour.

Les facteurs seront présentés non pas en fonction de la chronologie de leur annotation, ni même en fonction de la quantité des résultats obtenus mais plutôt dans l’ordre de leur intervention dans la transcription. Tout d’abord les facteurs qui jouent un rôle dans la décondensation de l’ADN permettant à la machinerie basale de transcription de se fixer juste en amont du site d’initiation de la transcription ; ensuite viendront les facteurs qui se fixent à certains éléments du promoteur proximal ; enfin, je présenterai les facteurs qui se fixent sur des séquences cis-régulatrices plus éloignées et qui interagissent avec la machinerie basale de transcription pour moduler, positivement ou négativement, le niveau d’expression des transcrits.

I - Facteurs de remodelage de la famille HMG

La structure de l’ADN (Figure 4) est une structure dynamique qui passe d’un état condensé à un état décondensé permettant aussi bien la transcription d’un gène que la réplication ou la réparation de l’ADN. L’état condensé, dû aux protéines histones ainsi qu’à certaines protéines non-histones, limite l’accès des facteurs de transcription à leurs séquences cibles. Il est donc indispensable que l’ADN se décondense localement, de façon à ce que la machinerie basale de transcription ainsi que les facteurs de transcription puissent se fixer à l’ADN.

Il est maintenant reconnu que certaines protéines agissent comme des facteurs de remodelage de la chromatine. Parmi ces facteurs, on trouve les histones elles-mêmes qui, par

un jeu d’acétylation-désacétylation, présentent une plus ou moins grande affinité pour la chromatine (voir p. 56). Il existe d’autres protéines de remodelage de la fibre chromatinienne qui sont des protéines chromosomiques non-histones : ce sont les petites protéines HMG (pour High Mobility Group).