• Aucun résultat trouvé

dans l’interaction avec son hôte invertébré (Biomphalaria glabrata) : recombinaison, épissage alternatif, transcription indépendante et

II. B ASES GENETIQUES DU POLYMORPHISME DES

1. Le polymorphisme des SmPoMuc au niveau génomique

1.1. Evolution des gènes selon le modèle « birth and death »

Le modèle « birth and death » (Nei, Hughes, 1992) est un modèle qui a été proposé afin d’expliquer l’évolution de certaines familles multigéniques, notamment celles en rapport avec le système immunitaire, comme les immunoglobulines (Ota, Nei, 1994) (cf. i-I.1.1.1 Immunoglobulines et TCR) et le CMH (Hughes, Nei, 1990) (cf. i-I.1.1.2. Complexe Majeur d’Histocompatibilité). Ce modèle prédit la création, perpétuelle et fréquente, de nouveaux gènes par duplication. Ces duplications sont souvent le résultat de « crossing over » inégaux entre gènes (Zhang, 2003). Les gènes dupliqués (ou paralogues) peuvent alors devenir progressivement des gènes non fonctionnels (pseudogènes). En effet, lorsqu’ils ne sont pas sous sélection, ils vont accumuler progressivement des mutations jusqu’à devenir des gènes non fonctionnels (processus de pseudogénéisation, (Lynch, Conery, 2000)). Toutefois, certains gènes dupliqués sont maintenus dans le génome afin de remplir des fonctions spécifiques. Deux mécanismes, empêchant la pseudogénéisation, peuvent être responsables du maintien de ces gènes. Tout d’abord le mécanisme de conversion génique (Palmer, Brayton, 2007), qui correspond à des échanges non réciproques de séquences similaires entre gènes. L’intervention de ces échanges à une fréquence élevée se traduira par une forte similarité de séquence entre les gènes paralogues. Ainsi, ces gènes évoluent de façon dépendante selon le modèle d’évolution concertée (Liao, 1999). Un autre moyen d’empêcher

la divergence des gènes dupliqués est qu’ils soient soumis à une forte sélection purificatrice. Cette sélection agirait principalement (mais pas uniquement) par l'élimination des mutations désavantageuses, impliquant la conservation des mutations neutres (Zhang, 2003).

Ainsi, les familles multigéniques qui évoluent sous le modèle « birth and death » (Nei, Rooney, 2005), sont caractérisées par des gènes et de nombreux pseudogènes organisés en tandem sur le même chromosome. Ce mode d’évolution rapide explique également la faible divergence de séquence entre gènes et pseudogènes. Toutes ces caractéristiques sont partagées par la famille multigénique codant les SmPoMuc. En effet, cette famille est constituée de 6 à 9 membres qui peuvent être divisés en quatre groupes de séquences paralogues (gr.1-gr.4) (Roger et al., 2008c). Les trois premiers groupes correspondent à des gènes exprimés. Le quatrième groupe et certains sous-groupes du troisième groupe semblent ne pas être exprimés et sont probablement des pseudogènes. De plus, des pseudogènes tronqués sont également présents. Ces gènes et pseudogènes sont organisés en tandem, au moins au niveau de deux des quatre loci identifiés (Roger et al., 2008c).

La famille multigénique codant les SmPoMuc semble donc évoluer sous le modèle de « birth and death ». Dans ce modèle la création / pseudogénéisation fréquente de gènes favorise ainsi la création de nouveaux allèles et donc le polymorphisme génétique.

1.2. Recombinaisons fréquentes à l’origine des gènes mosaïques

Comme nous l’avons énoncé ci-dessus, un gène dupliqué peut maintenir sa fonction dans le génome soit par conversion génique soit sous sélection purificatrice. Pour distinguer ces deux processus, il est possible d’analyser les différences nucléotidiques synonymes (ou silencieuses), entre gènes dupliqués, au niveau des régions codantes (Nei, Gojobori, 1986). En effet, ces différences synonymes sont peu sujettes à la sélection et ne seront pas éliminées par la sélection purificatrice. En revanche, la conversion génique, qui permet l’homogénéisation des séquences entre les gènes paralogues, peut conduire à leur élimination. Cette analyse, réalisée sur les séquences codantes de la région 3’ des groupes 1 à 4, révèle que les SmPoMuc évoluent sous sélection purificatrice (Roger et al., 2008c).

Cependant, cette évolution de type « birth and death » n’explique pas à elle seule l’extraordinaire degré de polymorphisme des SmPoMuc. Ainsi, des évènements fréquents de recombinaison semblent intervenir au niveau de la région 3’ (Roger et al., 2008c). Ces recombinaisons ont lieu non seulement entre gènes, mais également avec les pseudogènes, conduisant ainsi à la génération de nouveaux gènes « mosaïques ». Les pseudogènes bien que non fonctionnels, peuvent servir de réservoir de séquences et participer ainsi au

polymorphisme des SmPoMuc. En effet, ils sont libres d’accumuler des mutations et coexistent dans la même zone génomique que des copies fonctionnelles. Les pseudogènes peuvent alors être déplacés en partie ou dans leur totalité par recombinaison et se trouver dans un contexte génomique qui leur permettrait à nouveau d’être transcrits et donc réactivés. Ce type de mécanisme générateur de variabilité est également observé pour les vsg chez T. brucei (Roth et al., 1989) (cf. i-I.2.2.1.a. Conditions nécessaires à la variation antigénique des VSG chez T. brucei) et les gènes du CMH (Doxiadis et al., 2006) (cf. i-I.1.1.2.b. Polymorphisme du CMH). Par ailleurs, chez S. mansoni, ce phénomène de remodelage fréquent des gènes codant les SmPoMuc se traduit par la présence d’événements d’insertion/délétion encadrés de courtes séquences répétées, de solo-LTR ou encore de gènes interrompus par des rétrotransposons. Ces éléments mobiles représentent 55% des 270 Mb du génome de S. mansoni (Brindley et al., 2003). Ils sont également présents dans les régions intergéniques des gènes codant les SmPoMuc. Ces rétrotransposons pourraient ainsi être à l’origine de recombinaisons, de réarrangements chromosomiques, et de duplications qui ont abouti à l’émergence de la famille multigénique (Vitte, Panaud, 2005) et également à l’origine du polymorphisme génique de la région 3’ des gènes codant les SmPoMuc.

1.3. Recombinaisons ectopiques et diversité combinatoire

Le polymorphisme observé au niveau du domaine VNTR des SmPoMuc, décrit précédemment (cf. d-I.1.2. Les SmPoMuc, polymorphisme et statut de glycosylation), se traduit par un polymorphisme de taille et par un polymorphisme combinatoire. Ce dernier se caractérise par la présence des deux types d’UR r1 et r2, combinées au sein du même domaine VNTR. Nous avons également montré la présence de cette combinatoire au niveau génomique (Roger et al., 2008c). Toutefois, l’analyse de l’organisation génomique des gènes codant les SmPoMuc, et plus particulièrement de deux loci parmi les quatre identifiés par FISH (Roger et al., 2008c), révèle que ces loci sont associés spécifiquement à l’un des deux types d’UR. Nous suggérons ainsi que cette combinatoire, au niveau génomique, pourrait être générée par des mécanismes de recombinaisons ectopiques entre ces deux loci associés respectivement aux exon 2 codant soit les UR r1 soit r2.

L’analyse de la structure des gènes codant les SmPoMuc a révélé certaines caractéristiques, permettant d’expliquer cette combinatoire observée au niveau du domaine VNTR et également au niveau génomique. La région 5’ des gènes, codant le domaine VNTR, est constituée d’UR génomiques (URg). Ces URg sont composées d’un exon 2

(codant les UR r1 ou r2) encadré par des séquences introniques (Roger et al., 2008c). Ces introns sont caractérisés par la présence d’un microsatellite imparfait ou « polypurine tract » imparfait. Il s’agit d’une séquence, composée essentiellement de l’enchaînement de dinucléotides (GA)n, qui est parfois interrompue (imparfait) par des nucléotides C ou T. De plus, les URg sont très conservées et partagent un niveau de similarité très élevé (93%). C’est une caractéristique de régions géniques répétées qui n’évoluent pas de façon indépendante mais de concert (évolution concertée) (Liao, 1999).

L’évolution concertée, comme nous l’avons énoncée précédemment (cf. d-II.1.1. Evolution des gènes selon le modèle « birth and death »), conduit à l’homogénéisation de séquences répétées (Elder, Turner, 1995). Ce phénomène a été observé pour différentes familles multigéniques, telles que la famille codant les ARN ribosomiques (Schlotterer, Tautz, 1994) ou encore les snRNA U2 (« small nuclear ARN U2 ») (Liao, Weiner, 1995). Elle a également été rapportée chez des familles multigéniques codant des protéines, telles que les SOWgp de Coccidioides, que nous avons décrits précédemment (cf. d-I.2.2. Les SOWgp chez Coccidioides immitis et C. posadasii). La région des gènes codant la région riche en proline des SOWgp est composée d’exons et d’introns constituant des URg organisées en tandem, qui sont extrêmement conservées entre elles (Johannesson et al., 2005). A l’heure actuelle, deux mécanismes principaux sont capables d’expliquer ce type d’évolution concertée, les « crossing over » inégaux (Smith, 1976) et la conversion génique (Hillis et al., 1991). Les évènements de « crossing over » inégaux, interviennent préférentiellement au centre de la région génique contenant les URg. Les URg sur lesquelles se produisent les « crossing over » inégaux peuvent s’associer de façon décalée (« mispairing ») notamment au moment des méioses. Ceci conduit à l’augmentation ou à la contraction du nombre d’URg (Elder, Turner, 1995). Ce phénomène pourrait expliquer le polymorphisme de taille observé au niveau du domaine VNTR des SmPoMuc. Ces « crossing over » inégaux conduisent au renouvellement des URg (préférentiellement celles du centre de la région) et en principe à la fixation stochastique d’un type d’URg. Ce cas de figure est observé au niveau des gènes codant les SOWgp, où la similarité entre URg décroît au fur et à mesure que l’on s’éloigne du centre et se rapproche des URg terminales (Johannesson et al., 2005). En revanche, ce n’est pas le cas des gènes codant les SmPoMuc où toutes les URg sont similaires à 93%, y compris les URg terminales. Nous supposons donc que le mécanisme de conversion génique, qui lui aussi peut expliquer l’évolution concertée des URg, pourrait jouer dans la région 5’ des gènes codant les SmPoMuc. En effet, ce mécanisme permet l’échange non réciproque d’ADN entre séquences similaires (Schimenti, 1999). De plus, il permet l’homogénéisation de séquences entre chromosomes

homologues mais également non homologues (Abdulkarim, Hughes, 1996; Amstutz et al., 1985). La conversion génique pourrait ainsi expliquer l’évolution concertée des URg de tous les membres de la famille multigénique codant les SmPoMuc (Roger et al., 2008c).

Le mécanisme de conversion génique n’est, à l’heure actuelle, pas élucidé. Cependant, il semblerait que des séquences agissant en cis puissent avoir une influence sur ce phénomène. En effet, la présence de séquences répétées de type microsatellite pourrait influencer le degré d’identité partagé par les gènes d’une famille. Cela est très bien illustré chez deux familles de gènes, ErA et ErB, codant le chorion chez Bombix mori (Hibner et al., 1991). Ces deux familles de gènes bien que proches sur le chromosome, présentent des degrés de similarité différents, 96% et 63% respectivement. Cette différence semble être due à la présence de séquences répétées de type microsatellite, qui favoriseraient la conversion génique et donc l’homogénéisation, préférentiellement chez ErA (Hibner et al., 1991). Une autre étude a été réalisée sur le locus RNU2 codant les snRNA U2 chez l’homme (Liao, Weiner, 1995). Ces gènes sont organisés en tandem au niveau d’un locus et évoluent de manière concertée (Matera et al., 1990; Westin et al., 1984). Cette étude suggère également l’implication de microsatellites imparfaits en tant que site initiateur de la recombinaison et/ou la conversion génique (Pavelitz et al., 1995). En effet, ces microsatellites peuvent adopter des conformations qui diffèrent de la conformation classique de l’ADN en hélice droite (« B conformation ») (Majumdar, Patel, 2002; Wells, 1988). Plus particulièrement, les « polypurine tracts », que l’on retrouve au niveau des gènes codant les SmPoMuc, sont susceptibles d’adopter une conformation en triple hélice (« H-DNA conformation ») (Bacolla, Wells, 2004). Ces conformations en triple hélice sont favorables aux évènements de recombinaisons (Biet et al., 2003; Zhurkin et al., 1994) et sont susceptibles d’induire des cassures doubles brins de l’ADN (Bacolla et al., 2004; Wang, Vasquez, 2006). Ces cassures doubles brins sont alors prises en charge par le système de réparation de l’ADN (« Double-Strand-Break Repair »). Chez la levure, ce type de réparation peut se solder par un phénomène de conversion génique (Szostak et al., 1983).

Par ailleurs, cette homogénéisation intervient uniquement au niveau des introns des URg. En effet, les exons 2, codant les UR de type r1 et r2, encadrés par ces introns, sont différents entre loci (Roger et al., 2008c). Cette observation a également été faite lors de l’analyse du gène Flag codant un type de soie élastique chez l’araignée Nephilia clavipes. Les gènes codant les SmPoMuc présentent une architecture et un mode d’évolution similaire à ce gène. Il est composé d’une région constituée d’introns et d’exons répétés en tandem. Dans ce cas également, les séquences des introns sont plus conservées entre elles que les exons, qui semblent, quant à eux, évoluer sous sélection purificatrice (Hayashi, Lewis,

2000). Ainsi, les « polypurine tracts », faciliteraient les réarrangements lors des mitoses et méioses. Ils pourraient être à l’origine du phénomène de conversion génique, permettant l’homogénéisation inter-allélique et inter-locus des URg des gènes codant les SmPoMuc. Ces « polypurine tracts » pourraient également être à la base de la diversité combinatoire, observée au niveau des ADN complémentaires, en facilitant les échanges d’exons par des phénomènes de recombinaison ectopique entre les gènes (Puchta, 1999).