• Aucun résultat trouvé

Distance boîte - ATG

II. Expression de familles de gènes

A. Familles de gènes « de maintenance » et expression constitutive

Les gènes dits « de ménage » ou « de maintenance » appartiennent souvent à des familles multigéniques. Ces gènes codent des composants structuraux de la cellule comme les actines ou les tubulines, d’autres appartiennent à des mécanismes fondamentaux tels que la transcription ou la traduction, comme les ARN ribosomiques et les facteurs d’élongation EF1α, et d’autres encore sont impliqués dans les mécanismes de dégradation des protéines comme les ubiquitines. Nombre de ces gènes dits « de ménage » sont utilisés comme témoins d’expression constitutive lors des études d’expression transcriptionnelle. Sur le plan de l’expression, ces catégories de gènes sont classiquement opposées aux familles de gènes dont la fonction implique une expression spécifique. C’est le cas des gènes du cycle cellulaire, des gènes répondant à différents stimuli comme les attaques de pathogènes, la température ou la lumière, et des gènes impliqués dans un métabolisme particulier, par exemple l’assimilation de l’azote. Une double règle de pensée concernant l’expression des gènes semble se dégager de ces faits : d’une part, les gènes appartenant à des familles dites « de maintenance » présenteraient une expression constitutive et d’autre part, les gènes des autres familles présenteraient une expression spécifique.

Il est cependant important de préciser la notion d’expression constitutive. Le terme constitutif signifie que l’expression d’un gène est similaire d’un échantillon à l’autre et qu’elle peut donc être utilisée comme référence pour normaliser les mesures. Mais, la notion d’expression constitutive varie selon les expérimentations : elle dépend de la nature des échantillons comparés. En effet, lorsque l’expression est mesurée dans une plante soumise à un stimulus, la lumière par exemple, et dans une plante non soumise à ce stimulus, l’expression du gène de référence ne doit pas être modifiée par le stimulus en question. De même, lorsqu’il s’agit de comparer l’expression dans différents organes, il est nécessaire de trouver un gène exprimé avec la même intensité dans tous les organes testés. Ainsi, un gène exprimé spécifiquement dans un organe précis mais non régulé par un stimulus donné répondra à la définition de témoin constitutif dans une étude d’expression en réponse à ce stimulus réalisée uniquement dans cet organe.

Les ARN hélicases à boîte DEAD sont considérées comme une famille de gènes « de maintenance » par leur rôle fondamental dans le métabolisme de l’ARN. L’expression transcriptionnelle constitutive de la majorité des AtRH comme celle des facteurs d’élongation

EF1α (Axelos et al., 1989; Liboz et al., 1990) semble conforter l’hypothèse que les familles de gènes « de maintenance » présentent une expression constitutive d’un organe à l’autre. Cependant, les exemples d’étude d’expression transcriptionnelle d’autres familles de gènes « de maintenance » comme les actines (An et al., 1996a; An et al., 1996b; Huang et al., 1996; McDowell et al., 1996a; McDowell et al., 1996b; Huang et al., 1997; Kandasamy et al., 2001), les tubulines α et β (Ludwig et al., 1987; Oppenheimer et al., 1988; Carpenter et al., 1992; Kim & An, 1992; Kopczak et al., 1992; Carpenter et al., 1993; Chu et al., 1998; Cheng et al., 2001), les ubiquitines (Gausing & Barkardottir, 1986; Callis et al., 1990; Sun & Callis, 1997) et les ATPases-H+ (Harper et al., 1994; Houlne & Boutry, 1994), montrent au contraire que ces gènes présentent plutôt des profils d’expression organe-spécifiques pouvant se superposer partiellement.

Ces résultats peuvent paraître surprenants car ces gènes sont très souvent utilisés comme contrôle d’expression constitutive. En fait, les différents niveaux et profils d’expression se complètent plus ou moins et, le signal constitutif observé expérimentalement reflète probablement l’abondance des transcrits de l’ensemble de la famille.

Certaines autres familles de gènes, chez lesquelles on pourrait s’attendre à une expression spécifique au vu de leur fonction, présentent une expression similaire dans tous les organes de la plante : les kinases shaggy AtSK en sont un exemple (Charrier et al., 2002). Chez les animaux, les villines présentent une expression spécifique, apparemment liée à une fonction spécialisée, alors que chez A. thaliana, les AtVLN s’expriment dans chaque cellule (Klahre et al., 2000). Les familles de gènes dont l’expression est constitutive sont peu nombreuses dans la littérature, d’autant plus que les expressions spécifiques sont plus souvent recherchées et mises en valeur.

B. Divergence des profils

Au cours de ce travail de thèse, l’expression de seulement un tiers de la famille a été analysée. L’étude a porté sur les principales branches de l’arbre et sur des gènes dans des situations évolutives différentes. Parmi les AtRH étudiés, seulement deux gènes présentent un profil d’expression différent et un niveau d’expression faible : AtRH58 et AtRH34. Le gène AtRH58 n’a pas d’orthologues dans les autres règnes. La protéine qu’il code est vraisemblablement adressée au chloroplaste. Le gène AtRH34 présente une plus grande différence d’expression entre les racines et les autres organes que les autres gènes AtRH. Sa séquence est très proche de celle d’AtRH2. L’orthologue présumé (complémentation non testée) de ces deux gènes

chez S. cerevisiae est FAL1, qui code une protéine intervenant au cours de la biogenèse des ribosomes. Le faible niveau d’expression et le profil différent des gènes AtRH58 et AtRH34 permettent d’envisager un début de divergence de fonction et de considérer l’existence d’un processus de néofonctionalisation pour ces deux gènes par rapport aux autres membres de la famille. Cependant, l’hypothèse d’un transfert du chloroplaste vers le noyau de l’ancêtre du gène AtRH58 sans modification de sa fonction n’est pas à exclure, auquel cas l’hypothèse de la néofonctionalisation ne serait valable que pour AtRH34. D’autres événements évolutifs (néofonctionalisation ou sous-fonctionalisation) pourraient être mis en évidence par une étude complète de la famille.

L’étude de l’expression transcriptionnelle de plusieurs familles de gènes par RT-PCR quantitative a été entreprise chez A. thaliana. Même si les protéines de ces familles assurent des fonctions très différentes, allant de la synthèse de la paroi (Yokoyama & Nishitani, 2001) à la signalisation cellulaire (Charrier et al., 2002), en passant par le transport du nitrate (Orsel et al., 2002a) la fermentation alcoolique (Kursteiner et al., 2003) ou la dégradation des protéines (Mladek et al., 2003), ces études partagent certains points communs. Tout d’abord, les familles étudiées sont de taille raisonnable : de 4 à 33 gènes. Ensuite, ces familles sont composées d’une plus ou moins grande proportion de gènes exprimés à des niveaux si faibles qu’il est difficile voire impossible d’étudier leur expression par Northern blot (Charrier et al., 2002; Balbi & Lomax, 2003; Kursteiner et al., 2003; Mladek et al., 2003). Au niveau de l’expression, on observe assez fréquemment qu’un ou deux gènes sont fortement exprimés, les autres membres étant limités à des niveaux faibles (Yokoyama & Nishitani, 2001; Kursteiner et al., 2003; Mladek et al., 2003; Tan et al., 2003). Enfin, des profils d’expression spécifiques ne sont observés que pour un nombre réduit de gènes par famille (Yokoyama & Nishitani, 2001; Charrier et al., 2002; Orsel et al., 2002a; Panchuk et al., 2002; Reintanz et al., 2002; Mladek et al., 2003). La différenciation des fonctions au sein des familles multigéniques semble être plus liée à une spécialisation subtile des profils d’expression qu’à une spécialisation drastique. D’autre part, la mise en place de cette spécialisation serait associée à une diminution du niveau de l’expression.

C. Divergence des niveaux d’expression

1. Proximité des séquences protéiques et niveau d’expression

En comparant les niveaux d’expression des AtRH avec leur place dans un arbre de distance basé sur la proximité de leur séquence protéique, on observe qu’au sein d’un groupe de gènes

très proches en séquence, les niveaux ont tendance à être différents (Figure 18, p.103). Comme dix-huit gènes sur vingt présentent le même profil d’expression mais à des niveaux différents, la régulation du niveau d’expression semble être une marque de différenciation des gènes dupliqués. Si un changement de niveau d’expression a une conséquence sur la fonction des gènes, la différence de niveau d’expression pourrait être une marque de divergence de fonction.

2. Niveau d’expression et rôle biologique

Chez la tomate, la taille des fruits est majoritairement contrôlée par le QTL fw2.2 (Frary et al., 2000). La variation de la taille du fruit entre les différentes espèces de tomate est plus associée à la variation du niveau de transcrit fw2.2 et de sa cinétique d’expression qu’à une variation de la séquence protéique elle-même (Cong et al., 2002; Nesbitt & Tanksley, 2002; Liu et al., 2003). En effet, les protéines FW2.2 des espèces à petits et à gros fruits partagent plus de 98% d’identité (Frary et al., 2000). Comme la taille du fruit est inversement proportionnelle à la quantité de transcrit fw2.2, la protéine FW2.2 agirait en exerçant un contrôle négatif sur les divisions cellulaires (Frary et al., 2000). Ainsi, l’exemple du gène fw2.2 montre que le niveau de transcrit peut avoir, dans certains cas, un effet biologique. Chez A. thaliana, il existe au moins 3 orthologues à ce gène : At1g14870, At1g14880 et At5g35525 pour lesquels respectivement 9, 5 et 3 EST sont identifiées.

Une autre indication montrant que les niveaux de transcrit ont une signification biologique réside dans l’obtention de phénotypes différents dans des mutants antisens variant par le niveau d’expression du gène-cible.

Les gènes dont la séquence a peu divergé ont tendance à présenter une expression différente (profil et/ou niveau). Deux hypothèses peuvent expliquer ce fait. D’une part, la pression de sélection sur la partie protéique est différente de celle exercée sur les promoteurs, permettant une variation plus rapide de ces derniers. Les gènes les plus récemment dupliqués, exceptés AtRH15 et 56, présentent des répartitions des boîtes télo et GGCCCA différente. La divergence des régions promotrices pourrait être un élément précédant le changement de transcription et de fonction.

D’autre part, les mécanismes de duplication ayant conduit à la formation de la famille des AtRH font intervenir des rétrotranscriptions (Boudet et al., 2001). Dans ce cas, la partie dupliquée ne concerne que la région exprimée et pas le promoteur, ce qui facilite le

changement de promoteur et l’apparition de nouvelles régulations. Ainsi, plusieurs mécanismes peuvent être impliqués dans la divergence de l’expression des gènes d’une famille et la régulation de l’expression participe au contrôle de la fonction des gènes.