• Aucun résultat trouvé

génomes d’Archaea

Chez les Archaea, la majorité des gènes de la réplication ont été identifiés par homologie avec les gènes codant les protéines impliquées dans la réplication de l’ADN chez les eucaryotes (voir Introduction). Globalement, la machinerie de réplication chez les archées actuelles ressemble à une version simplifiée de la machinerie de réplication de la plupart des eucaryotes (Lao-Sirieix et al., 2007) ; comparable à celle des organismes eucaryotes ayant adopté un mode de vie parasitaire (Morrison et al., 2007). Néanmoins, rien n’indique que l’ensemble des gènes de la réplication ont été identifiés dans les génomes archéens et eucaryotes, comme en témoigne la récente caractérisation du complexe GINS chez les eucaryotes puis les archées (Kanemaki et al., 2003; Kubota et al., 2003; Makarova and Koonin, 2005; Makarova et al., 2005; Marinsek et al., 2006; Takayama et al., 2003). En outre, certains gènes de la réplication sont inidentifiables dans certains génomes d’Archaea (Fitz-Gibbon et al., 2002; Slesarev et al., 2002; White, 2003; Yamashiro et al., 2006). Premièrement, certains gènes de fonction inconnue présents dans des génomes d’Archaea pourraient se révéler être des homologues distants de certains gènes de réplication eucaryotes (Robinson and Bell, 2007). Deuxièmement, il est possible que de nouvelles protéines de la réplication, exclusives des Archaea, soient découvertes à l’avenir : soit qu’ils s’agissent d’innovations archéennes — à l’image de la PolD (Ishino et al., 1998; Uemori et al., 1997) —, soit que le gène correspondant ait été perdu ou remplacé par un gène non orthologue dans la lignée conduisant aux eucaryotes après la divergence entre Archaea et Eucarya (Koonin et al., 1996).

La génomique comparative s’est imposée comme une approche précieuse — complémentaire des méthodes basées sur la recherche d’homologie — pour l’annotation des génomes et pour approfondir notre connaissance de l’évolution et de la physiologie des organismes, y compris chez les Archaea (pour des revues, voir (Ettema et al., 2005; Makarova and Koonin, 2003a, 2005)). En ce qui concerne la réplication, la génomique comparative a notamment permis de conduire à l’identification d’une nouvelle classe de thymidylate synthase (Myllykallio et al., 2002), des homologues archéens des protéines Gins (Makarova and Koonin, 2005; Makarova et al., 2005) et d’un homologue probable de la protéine eucaryote Cdt1 (Robinson and Bell, 2007). Par ailleurs, des associations entre gènes de la réplication ont déjà été décrites de manière ponctuelle (Myllykallio et al., 2000; Robinson et al., 2004) mais rarement de façon systématique. Aussi, nous avons décidé d’analyser le contexte génomique de tous les gènes de la réplication afin de dégager d’éventuelles tendances quant à la disposition réciproque de ces gènes au sein des génomes d’Archaea. La présence d’associations conservées de gènes impliquant des gènes de la réplication devaient permettre de :

1) prédire de nouvelles interactions fonctionnelles entre protéines de la réplication lorsque les gènes correspondants sont contigus dans de nombreux génomes ;

2) identifier de probables nouvelles protéines de la réplication sous la forme de gènes de fonction inconnue situés de manière récurrente à côté d’un gène de réplication.

Le chapitre qui s’ouvre dans les pages suivantes s’articulera autour des éléments développés dans un article scientifique et une courte revue :

ƒ L’article scientifique concerne les résultats de l’analyse comparative des génomes d’Archaea centrée sur l’étude du contexte génomique des gènes de la réplication. Cette analyse nous a permis d’identifier des associations conservées entre gènes de la

réplication à partir desquelles nous avons inféré de nouvelles connections fonctionnelles au sein du réplisome. D’autre part, les résultats de ce travail suggèrent qu’il existe des interactions fonctionnelles entre la réplication et d’autres processus cellulaires de traitement de l’information génétique. En particulier, cette approche ciblée nous a permis de mettre en évidence une association conservée entre des gènes de la réplication et des gènes liés au ribosome ou à la traduction qui n’est pas répertoriée dans la base de données STRING (von Mering et al., 2007) — une base de données dédiée à la recherche d’interactions entre gènes ou protéines. Ce regroupement de gènes en une structure de type opéron suggère selon nous que la réplication de l’ADN et la synthèse des protéines pourraient faire l’objet d’une co-régulation.

ƒ La courte revue vient dans le prolongement de l’article scientifique. Dans cette revue, nous développons et mettons en perspective les interprétations esquissées dans la discussion de l’article à la lumière des connaissances actuelles concernant le couplage fonctionnel entre la réplication et la traduction. En particulier, nous dressons un panorama succinct des travaux réalisés chez les bactéries sur le rôle du (p)ppGpp dans la régulation coordonnée entre la réplication et la traduction. Les études concernant le rôle des petites protéines fixant le GTP de la famille Obg sont également évoquées. Puis, nous présentons les quelques données expérimentales suggérant l’existence d’un couplage fonctionnel entre réplication, traduction et biogenèse du ribosome chez les eucaryotes. Enfin, nous mettons en perspective les résultats et les interprétations issues de l’analyse comparative des génomes d’Archaea à la lumière des données bibliographiques existantes. Pour conclure, nous proposons un modèle pour un système permettant de réguler de façon dynamique la réplication et la traduction chez les Archaea et les Eucarya. Ce modèle se base principalement sur les associations de gènes mises en évidence par l’analyse comparative des génomes d’Archaea.

Les approches de génomique comparative n’ont qu’une valeur prédictive et les hypothèses formulées dans le cadre de cette étude du contexte génomique demandent à être étayées par des données expérimentales. La pertinence biologique de deux des interactions prédites par l’analyse du contexte génomique a été mise à l’épreuve en réalisant des expériences in vitro ; celles-ci seront décrites et discutées dans le chapitre suivant.

Au cours de la phase préparatoire de l’analyse du contexte génomique, un inventaire de l’ensemble des gènes codant des protéines de la réplication dans les génomes d’Archaea entièrement séquencés a été dressé, puis mis à jour au gré de la mise à disposition de nouvelles données. L’analyse de la distribution phylétique de ces gènes au sein du domaine Archaea donne une idée approximative de l’histoire évolutive de ces gènes (duplication, perte). Cette analyse sommaire nous a néanmoins permis de reconstruire la composition protéique probable de la machinerie de réplication du dernier ancêtre commun des Archaea. Les résultats de cette analyse seront abordés dans le chapitre IV.

Article

Genomic context analysis in Archaea suggest