• Aucun résultat trouvé

Fig.4.7: Motif utilis´e pour la requˆete effectu´ee sur la version locale de la banque HOGENOM

1 L’ajout des s´equences de g´enomes aux banques de familles de g`enes homologues

Nous pr´esentons ici trois exemples de transferts horizontaux de g`enes vers Frankia d´etect´es :

– Le premier exemple est celui d’un g`ene potentiellement acquis par l’ancˆetre actuel des Frankia d’une Alpha-Prot´eobact´erie (figure 4.8). Le g`ene ´etudi´e correspond `a celui codant pour la Prephenate dehydratase. Il est int´eressant de remarquer que toutes les Alpha-Prot´eobact´eries de l’arbre sont ´egalement des bact´eries fixatrices d’azote.

Fig.4.8: Exemple de transfert horizontal d’un g`ene d’une Alpha-Prot´eobact´erie vers Frankia ACN, EAN et CcI3.

– Le deuxi`eme exemple traite un g`ene potentiellement acquis par Frankia ACN d’une Alpha-Prot´eobact´erie (figure 4.9). Le g`ene analys´e est celui codant pour la Glutamine Synth´etase III. Ce g`ene intervient dans la fixation d’azote chez les Frankia et les Alpha-Prot´eobact´eries.

– Le troisi`eme exemple est celui de transferts de deux g`enes d’une Alpha-Prot´eobact´erie qui se seraient suivis d’une duplication chez Frankia EAN (fi-gure 4.10). Les deux g`enes correspondent `a ceux codant pour les sous-unit´es I et II de la Sulfate ad´enylyltransf´erase qui sont situ´es `a cot´e sur un chromosome. Ces g`enes ont une histoire ´evolutive tr`es proche comme l’indique la ressemblance des deux arbres phylog´en´etiques.

Fig.4.9: Exemple de transfert horizontal d’un g`ene d’une Alpha-Prot´eobact´erie vers Frankia ACN.

Fig.4.10: Deux exemples de transferts horizontaux de deux g`enes d’une Alpha-Prot´eobact´erie, sui-vis d’une duplication chez Frankia EAN.

1 L’ajout des s´equences de g´enomes aux banques de familles de g`enes homologues

L’analyse phylog´en´etique r´ealis´ee propose des estimations plutˆot conservatrices du nombre de transferts horizontaux de g`enes identifi´es phylog´en´etiquement dans Frankia,

´etant donn´e que seuls des g`enes qui ont des homologues dans des g´enomes d’organismes

´evolutivement lointains de Frankia sont utilis´es pour l’analyse. Afin d’identifier d’autres g`enes possibles qui pourraient avoir ´et´e acquis parFrankia, une analyse bas´ee sur le crit`ere d’incongruence phylog´en´etique (Zelwer & Daubin, 2004) a ´et´e utilis´ee.

Les g`enes qui sont pr´esents dans le g´enome de Frankia et absents des g´enomes de Streptomyces ont ´et´e recherch´es. Pour cela, une analyse de toutes les familles contenant au moins une s´equence deFrankia a ´et´e effectu´ee afin de ne conserver que les familles ne contenant pas de s´equences deStreptomyces. 380 familles ont ainsi ´et´e d´etect´ees.

Streptomyces est le groupe soeur de Frankia dans la phylog´enie actuelle des orga-nismes compl`etement s´equenc´es et poss`ede un g´enome tr`es grand. Bien que l’absence de g`enes homologues `a Frankia dans les g´enomes de Streptomyces ne soit pas une preuve de transferts horizontaux, il est possible que Streptomyces ait gard´e la plupart des g`enes de leur ancˆetre commun, et la classe de g`enes pr´esents chez Frankia et non chez Streptomyces est probablement enrichie en transferts horizontaux. Un tableau regroupant l’ensemble des familles correspondant `a cette analyse est pr´esent´e en annexe (annexe B page 139). Dans ce tableau, on retrouve pour chaque famille, son annotation dans la base de donn´ees, les s´equences de Frankia pr´esentes dans la famille et les s´equences les plus proches d’Actinobact´erie dans l’arbre.

Pour chacune des analyses effectu´ees (l’analyse phylog´en´etique et l’analyse li´ee `a l’ab-sence de g`enes chezStreptomyces), nous avons compt´e le nombre de transferts horizontaux de g`enes vers l’une des trois souches deFrankia correspondant aux cat´egories COG (Clus-ters of Orthologous Groups). La banque COG (cf. chapitre 1, page 1 section 2.2, page 13) contient les s´equences de g´enomes complets. Elle regroupe, en familles, des g`enes homo-logues en se basant sur les meilleures similarit´es BLAST r´eciproques. Cette classification en cat´egorie permet d’avoir des informations sur les fonctions des g`enes ainsi que des indications sur l’´evolution des organismes.

Pour chaque s´equence de Frankia, pr´esentes dans les familles d’HOGENOM (version locale) o`u un transfert horizontal a ´et´e d´etect´e, nous avons utilis´e BLASTP pour la com-parer avec les s´equences de la banque COG afin d’en extraire la plus similaire. Puis nous avons d´etermin´e la cat´egorie COG de chacune des s´equences similaires et trouv´e ainsi celle associ´ee `a chaque s´equence de Frankia. Nous avons ensuite regroup´e les s´equences de Frankia en fonction de la famille `a laquelle elles appartenaient, ce qui nous a permis d’associer `a chaque famille dans laquelle un transfert horizontal de g`enes a ´et´e d´etect´e une ou plusieurs cat´egories COG. Ainsi nous avons obtenu un premier classement donnant le nombre de transferts horizontaux de g`enes vers Frankia correspondant `a chacune des cat´egories COG. Ces r´esultats sont r´esum´es dans les tableaux pr´esent´es dans la figure 4.11 et la figure 4.12.

Fig.4.11: Nombre de transferts horizontaux de g`enes vers l’une des trois souches de Frankia cor-respondant aux cat´egories COG r´esultant de l’analyse phylog´en´etique.

1 L’ajout des s´equences de g´enomes aux banques de familles de g`enes homologues

Fig.4.12: Nombre de transferts horizontaux de g`enes vers l’une des trois souches de Frankia cor-respondant aux cat´egories COG r´esultant de l’analyse li´ee `a l’absence de g`enes chez Streptomyces.

2 L’identification automatique de s´ equences d’ARNr 16S de bact´ eries

Nous avons ´etabli une autre collaboration avec Philippe Normand (Laboratoire d’Eco-logie Microbienne des Sols - UMR CNRS 5557 - Lyon1). Le projet avait pour but d’identifier automatiquement un ensemble de s´equences d’ARNr 16S de bact´eries issues de carottes glaciaires ou de sources hydrothermales afin de connaˆıtre, pour chaque s´equence, leur esp`ece et leur genre. Pour cela, il est n´ecessaire de d´evelopper un outil d’identification au-tomatique qui permette de traiter un ensemble de s´equences en d´eterminant pour chacune l’esp`ece de provenance et le genre. De plus, pour ce type de donn´ees, avant d’identifier les nouvelles s´equences, il serait int´eressant de v´erifier s’il ne s’agit pas de s´equences chim`eres (d´efinies plus bas). Nous avons donc travaill´e sur le d´eveloppement d’un outil d’identifica-tion automatique de s´equences bact´eriennes d’ARNr 16S incluant un module de d´etection de s´equences chim`eres.