• Aucun résultat trouvé

La diversite des microbiotes des isopodes

1. Caractérisation du microbiote des isopodes

1.1 Introduction

La plupart des isopodes, en particulier les cloportes, sont fortement perméables aux bactéries environnementales (Dittmer et al., 2016). Les bactéries transitoires issues de l’environnement constituent donc la part la plus importante de leur microbiote, et à ce jour aucun microbiote commun (« core microbiota ») n’a pu être clairement déterminé. Plusieurs symbiotes ont été observés dans diverses espèces d’isopodes aquatiques et terrestres, mais ils ne semblent pas spécifiques à l’hôte puisqu’il existe des populations où ces symbiotes sont absents (Bouchon et al., 2016). Nous avons vu dans l’Introduction générale de cette thèse que quatre symbiotes sont connus chez les isopodes : Wolbachia spp., Rickettsiella spp., Candidatus Hepatoplasma crinochetorum et Candidatus Hepatincola isopodorum. Wolbachia est une bactérie endosymbiotique manipulatrice du sexe (Bouchon

et al., 2008), elle est considérée comme un parasite de la reproduction. Rickettsiella est une

bactérie pathogène des arthropodes qui pourrait avoir évolué en symbiote mutualiste dans certaines populations (Bouchon et al., 2016). Enfin Candidatus Hepatoplasma et Candidatus Hepatincola sont deux bactéries dont le rôle reste inconnu et qui sont présentes principalement dans les caeca (Dittmer et al., 2016; Eberl, 2010; Fraune and Zimmer, 2008; Leclercq et al., 2014; Wang et al., 2004a, 2004b, 2007). Il est supposé qu’elles pourraient apporter des nutriments ou aider à la digestion et la détoxification des aliments (Zimmer, 2006). Ces bactéries ne sont pas cultivables, et leur identification par des méthodes de metabarcoding ne permet pas de voir leurs répertoires fonctionnels ; la métagénomique plein-génome pourrait aider à répondre à ces questions.

Les nouvelles méthodes de séquençage à haut débit ont révolutionné l’analyse des microbiotes : les approches de métagénomique ciblée (metabarcoding) ou plein-génome (shotgun) permettent en effet d’identifier l’ensemble des communautés microbiennes d’un environnement en séquençant un sous-ensemble de son matériel génétique (Albertsen et

al., 2013; Bork et al., 2015). L’identification des taxa microbiens connus dans un

163 assemblage, des contigs et des protéines (Ye et al., 2019). Dans les trois cas, les méthodes sont dépendantes de bases de données de référence pour classer les séquences. Un grand nombre d’études utilise des méthodes basées sur les lectures pour établir un profil taxonomique d’un échantillon métagénomique. Ces méthodes ont pour la plupart l’avantage de requérir moins de ressources informatiques que les méthodes classant les contigs ou les protéines, elles sont plus rapides car elles sont basées sur des gènes marqueurs, et elles permettent d’évaluer l’abondance des taxa (Ye et al., 2019). Plusieurs logiciels ont été développés pour classer les lectures, parmi lesquels MetaPhlAn2 et Kraken ainsi que ses dérivés Kraken2, Bracken et KrakenUniq, sont les plus populaires (Truong et al., 2015; Wood and Salzberg, 2014).

Néanmoins, les méthodes de classification reposant sur des bases de données ne permettent pas d’identifier toutes les séquences. La proportion de séquences non identifiées peut être très importante ; par exemple moins de 10% des séquences virales du projet Tara Océan et du virome humain sont connues (Gregory et al., 2019a, 2019b). Les métagénomes se composant d’une multitude de fragments de séquences appartenant à divers génomes, la reconstruction de ces génomes peut aider à l’identification de nouvelles espèces. Ces génomes assemblés à partir de données métagénomiques sont appelés MAGs (« Metagenome-Assembled Genomes »), un terme proposé par Hugerth et al. (2015) et validé par le Genome Standards Consortium (2017). La construction d’un MAG passe par le rassemblement de contigs en groupes de séquences appartenant à une même espèce génomique. Pour ce faire il existe des méthodes de classification indépendantes des bases de données, dites de « binning », qui utilisent l’abondance et/ou la composition des séquences pour regrouper les contigs en sous-groupes, appelés « bins » (Sedlar et al., 2017). Les bins résultants sont filtrés en fonction de leur qualité, de leur complétude (i.e. proportion de gènes orthologues consensuels à un taxon) et de leur contamination (i.e. proportion de séquences susceptibles d’appartenir à plusieurs espèces). Ceux passant ces différents critères de sélection sont validés, et ils peuvent être alors considérés comme des MAGs. De nombreuses études ont démontré l’intérêt du regroupement en MAGS : ils permettent l’identification de nouvelles espèces, et ils contribuent à une meilleure compréhension de la physiologie et de l’évolution des organismes (Hugerth et al., 2015;

Chapitre 3

164 Parks et al., 2017; Rinke et al., 2013; Spang et al., 2015; Stewart et al., 2018; Swan et al., 2011; Zaremba-Niedzwiedzka et al., 2017).

La combinaison des méthodes de classification dépendantes et indépendantes de la taxonomie pourrait aider à l’analyse de la composition et des fonctions du microbiote des isopodes. Les parties précédentes de la thèse se sont focalisées sur le microbiote digestif de cinq espèces d’isopodes. Dans ce chapitre, nous utilisons les 51 métagénomes précédemment obtenus pour caractériser le microbiote de ces cinq espèces à une échelle plus globale. L’objectif de ce chapitre est double : d’une part d’identifier le microbiote des cinq isopodes dans leur ensemble, et d’autre part de mieux caractériser les symbiotes des isopodes. Pour ce faire nous avons utilisé une approche dépendante de la taxonomie et une approche de binning. La première approche nous permet d’identifier les taxa composant les microbiotes en comparant les lectures à une base de données de marqueurs taxonomiques. La seconde approche nous permet, quant à elle, de reconstruire des MAGs pour mieux comprendre les fonctions des bactéries les plus abondantes dans le microbiote des isopodes. L’utilisation des MAGs nous permet également d’identifier et de caractériser de nouvelles espèces dans le microbiote des isopodes qui pourraient participer à la dégradation de la lignocellulose.

165

1.2 Matériels et Méthodes

Banques métagénomiques

Les 51 métagénomes utilisés dans cette étude sont les mêmes que ceux décrits dans le chapitre précédent (cf. Chapitre 2 : 2. Les isopodes, des modèles prometteurs pour étudier la

dégradation de la lignocellulose). Les métriques des assemblages sont décrites dans l’Annexe 1.

Ces données comprennent des métagénomes issus de séquençage des échantillons d’espèces d’isopodes élevées dans notre laboratoire et récoltées dans la nature, incluant une espèce dulcicole (Asellus aquaticus) et quatre espèces terrestres (Armadillidium vulgare,

Porcellionides pruinosus, Porcellio dilatatus dilatatus et Porcellio dilatatus petiti). Les différentes

étapes de la construction des métagénomes sont rappelées sur la Figure 21 et expliquées dans l’Annexe 2.

Figure 21. Diagramme résumant les différentes étapes de la construction des métagénomes. Pour plus de détails, se reporter à la partie « Chapitre 2 : 2. Les isopodes, des modèles prometteurs pour étudier la dégradation de la lignocellulose » et l’Annexe 2.

Chapitre 3

166 Profils taxonomiques des métagénomes

Les lectures nettoyées de chaque métagénome ont été importées dans Kraken (version 2.0.8 ; (Wood and Salzberg, 2014)) pour les assigner à un taxon connu (d’autres logiciels pour l’annotation taxonomique des métagénomes sont présentés dans l’Annexe 2). Le logiciel Kraken permet de faire un classement taxonomique rapide des lectures contenues dans une banque métagénomique. Il aligne les différents k-mers (i.e. sous-séquences de longueur k) des lectures à une base de données regroupant des marqueurs construits à partir de génomes de référence, puis il assigne la séquence à un taxon en se basant sur l’ancêtre commun le plus proche obtenu par le classement des k-mers. Les fichiers de sortie ont ensuite été importés dans Bracken (version 2.1.0 ; (Lu et al., 2017a)) afin d’estimer l’abondance de chaque taxon dans les échantillons. Les résultats ont été analysés avec le package Phyloseq (McMurdie and Holmes, 2013).

Détermination de MAGs par une approche de « binning »

Dans le but de classer les contigs par entité taxonomique, nous avons utilisé une méthode de binning indépendante de la taxonomie. Cette méthode permet de classer tous les contigs, y compris ceux appartenant à des espèces inconnues. Seuls les contigs supérieurs à 1500 pb ont été considérés et classés en bins avec MetaBAT2 (version 2.12.1 ; (Kang et al., 2019)). MetaBAT2 est un logiciel de binning se basant sur la fréquence et l’abondance des tétranucléotides de chaque contig pour les regrouper par bins. La qualité des bins générés par MetaBAT2 a été mesurée avec le logiciel CheckM (version 1.0.13 ; (Parks et al., 2015)). Ce logiciel fournit aussi une affiliation taxonomique des bins, et il évalue leur complétude et contamination en comparant les contigs à des ensembles de gènes qui sont ubiquistes et en copie unique dans une lignée phylogénétique donnée.

Reconstitution de génomes bactériens à partir des métagénomes

Les bins de bonne qualité et susceptibles de constituer le génome d’un taxon bactérien ont été isolés pour les analyses suivantes. Dans le but d’obtenir des génomes de meilleure qualité, les lectures ayant servi à assembler les bins ont été obtenues en alignant les lectures sur les contigs de chaque bin en utilisant BOWTIE2 (version 2.2.9 ;

167 (Langmead and Salzberg, 2012)). Elles ont ensuite été assemblées de novo en contigs en utilisant SPAdes (version 3.13.0 ; (Bankevich et al., 2012)) avec l’option --careful pour réduire le nombre de disparités et de courts indels (i.e. insertion ou délétion dans une séquence nucléique) dans les contigs.

Une fois les génomes réassemblés, les ARN ribosomaux ont été annotés avec RNAmmer (http://www.cbs.dtu.dk/services/RNAmmer/ ; (Lagesen et al., 2007)) pour tenter d’identifier le taxon, et la complétude de chaque assemblage a été évaluée avec BUSCO (version 3.0.2 ; (Simão et al., 2015)) en se référant à l’ensemble de gènes orthologues (OrthoDB ; Kriventseva et al. (2018)) correspondant à la position phylogénétique du génome. L’annotation fonctionnelle des génomes bactériens s’est faite grâce à Prokka (version 1.9 ; (Seemann, 2014)), puis les annotations ont été classées par groupes de gènes orthologues (Clusters of Orthologous Groups COG) (Tatusov, 2000) avec eggNOG-mapper (Huerta-Cepas et al., 2017). Enfin, dans le but d’identifier une éventuelle implication de ces bactéries dans la dégradation de la lignocellulose, dbCAN2 (Zhang et al., 2018) a permis d’annoter les CAZymes, et Hotpep (Busk et al., 2017) leurs fonctions enzymatiques (cf. Bredon et al. (2018, 2019) pour plus de détails sur ces deux logiciels). Les différentes étapes du binning des métagénomes et de l’assemblage des génomes bactériens sont résumées sur la Figure 22.

Chapitre 3

168

Figure 22. Diagramme résumant les différentes étapes du binning et de la reconstitution des génomes bactériens.

169

1.3 Résultats

Composition des microbiotes

L’identification de la composition des microbiotes par une approche de classification dépendante des bases de données (taxonomy dependant) a permis de classer 12,9% des lectures des métagénomes. Au total, Kraken a identifié 8 803 OTUs différents (i.e. Unité Taxonomique Opérationnelle : séquences regroupées sur la base de leur similarité) dans l’ensemble des métagénomes, avec une moyenne de 5 616 OTUs par métagénome (écart type = 254). Les comparaisons des lectures avec la base de données de Kraken montrent que les microbiotes d’isopodes sont composés à plus de 80% de bactéries, d’environ 10% d’archées et 10% de virus (Figure 23). Leur composition varie fortement d’une espèce à une autre et d’un tissu à un autre (Figure 24). Il y a également une différence marquée entre les microbiotes des deux populations d’A. aquaticus (Figure 24). Les microbiotes des isopodes se composent en majeure partie d’archées du phylum des Euryarchaeota (5% en moyenne), et de bactéries des phylums des Firmicutes (25% en moyenne), des Proteobacteria (50% en moyenne) et des Tenericutes (5% en moyenne) (Figure 25). La distribution de ces phylums est stable entre les espèces et les tissus, sauf pour les caeca de P. d. dilatatus et P. d. petiti où les Tenericutes représentent 70-80% du microbiote.

Chapitre 3

170

Figure 23. Abondance des archées, bactéries et virus connus dans les métagénomes calculée par Bracken (C = caeca ; HG = tube digestif et son contenu ; T = autres tissus). Les échantillons d’A. vulgare sont issus de notre étude Bredon et al. (2018), les tissus séquencés diffèrent des autres espèces : le contenu du tube digestif (GC) a été séparé du tissu du tube digestif (HGt), et les caeca ont été regroupés avec les tissus restants (TC).

171

Figure 24. Analyse comparative de la composition taxonomique des microbiotes. Les graphiques de positionnement multidimensionnel non métrique (NMDS) ont été construits à partir de l’abondance des différents taxa identifiés par Kraken dans les métagénomes. Le premier (A) comprend l’ensemble des échantillons, puis pour plus de visibilité, les échantillons d’A. vulgare (B) ont été séparés du reste des métagénomes (C).

Chapitre 3

172

Figure 25. Composition des microbiotes des isopodes. Les histogrammes montrent l’abondance calculée par Bracken des phylums bactériens majoritaires de chaque métagénome (C = caeca ; HG = tube digestif et son contenu ; T = autres tissus). Les échantillons d’A. vulgare sont issus de notre étude Bredon et al. (2018), les tissus séquencés diffèrent des autres espèces : le contenu du tube digestif (GC) a été séparé du tissu du tube digestif (HGt), et les caeca ont été regroupés avec les tissus restants (TC).

173 La plupart des bactéries abondantes dans les métagénomes appartiennent au phylum des Proteobacteria. La plus abondante est la bactérie Wolbachia, elle constitue une part importante du microbiote de P. d. dilatatus, P. pruinosus et de deux populations d’A.

vulgare (Figure 26). Elle est présente dans tous les tissus de ces espèces, et parfois même

en très grande proportion (jusqu’à 60% dans le tube digestif de P. pruinosus). L’isopode aquatique A. aquaticus héberge des Proteobacteria qui ne sont pas présentes chez les espèces terrestres. Des bactéries souvent associées aux plantes aquatiques du genre

Aquitalea ont été identifiées exclusivement dans les tissus non digestifs de la population

naturelle d’A. aquaticus (Figure 26A). D’autres Proteobacteria intéressantes ont été identifiées chez A. aquaticus, dont des Buchnera qui sont connues pour être des endosymbiotes des pucerons, et des Polynucleobacter, des bactéries associées la plupart du temps au plancton d’eau douce (Figure 26A-B). Les bactéries du système digestif du genre Escherichia représentent environ 4% du microbiote de toutes les espèces, sauf de P.

pruinosus (Figure 26). Les bactéries du genre Salmonella sont d’autres bactéries fréquentes

dans le tube digestif des animaux, elles ont été identifiées chez toutes les espèces terrestres (3% des microbiotes en moyenne). Des bactéries fixatrices d’azote du genre Ensifer ont également été identifiées en grand nombre (environ 30%) dans les caeca de P. pruinosus du laboratoire (Figure 26F). Enfin plusieurs Proteobacteria connues pour leur pathogénicité chez les animaux ont été identifiées chez les isopodes terrestres : des Yersinia (3% en moyenne du microbiote des tissus de chaque isopode terrestre), des Vibrio (25% des caeca et tube digestif de la population naturelle de P. pruinosus) et des Mannheimia (3% en moyenne du microbiote des tissus d’A. vulgare).

Les Tenericutes sont essentiellement représentées par des bactéries du genre

Candidatus Hepatoplasma dans toutes les espèces sauf pour P. pruinosus (Figure 26). Elles

sont principalement présentes dans les caeca, et représentent jusqu’à plus de 70% du microbiote de certains échantillons (caeca de P. d. dilatatus et P. d. petiti). Les Firmicutes sont quant à elles principalement représentées par des bactéries des genres Bacillus et

Staphylococcus. Ces bactéries ubiquistes dans les écosystèmes ont été identifiées dans tous

les échantillons où elles représentent 15% en moyenne du microbiote de chaque espèce (Figure 26).

Chapitre 3

174 Enfin nous n’avons pas identifié d’espèce d’archée abondante dans les microbiotes bien que les Euryarchaeota soient présentes dans tous les échantillons, et qu’elles représentent jusqu’à plus de 10% du microbiote des espèces terrestres (Figure 25). Les bases de données publiques sont peu fournies en séquences d’archées comparées aux bactéries. Par exemple dans la base de données nucléotidique de NCBI (www.ncbi.nlm.nih.gov/nucleotide/), il y a, à l’heure où ces lignes sont écrites, 59 622 375 séquences nucléotidiques de bactéries référencées contre seulement 874 269 séquences nucléotidiques d’archées (soit 1,4%). Il est donc probable que la plupart des archées contenues dans les métagénomes n’ont pas pu être identifiées au genre voire à la famille.

Figure 26. Bactéries majoritaires dans les microbiotes d’isopodes. Les histogrammes montrent l’abondance calculée par Bracken des bactéries les plus abondantes identifiées dans chaque échantillon (C = caeca ; HG = tube digestif et son contenu ; T = autres tissus). Les autres taxa identifiés dans les microbiotes ont été regroupés dans « Autres ». Les échantillons d’A. vulgare sont issus de notre étude Bredon et al. (2018), les tissus séquencés diffèrent des autres espèces : le contenu du tube digestif (GC) a été séparé du tissu du tube digestif (HGt), et les caeca ont été regroupés avec les tissus restants (TC).

175 Reconstitution de MAGs par une approche de binning

La méthode de binning a permis de classer 1 056 396 contigs en 180 bins allant de 200kb à 227Mb (Figure 27). Pour la suite de l’étude, nous nous sommes focalisés sur les

bins de bonne qualité, c’est-à-dire ceux dont la complétude était supérieure à 80% avec un

taux de contamination inférieur à 5% (Figure 27, Tableau 3). Au total, 45 bins remplissaient ces critères. Ils ont été affiliés à 15 taxa bactériens, incluant plusieurs Rickettsiales, Mollicutes et Vibrionaceae. Cinq bins bactériens n’ont pu être affiliés à aucun taxon.

Seuls les contigs supérieurs à 1,5kb ont été utilisées pour le binning, filtrant ainsi une grande partie des contigs des métagénomes d’A. vulgare. En conséquence, très peu de

bins ont été obtenus à partir des métagénomes d’A. vulgare, et aucun d’entre eux n’a passé

nos critères de sélection (complétude > 80% et contamination < 5%). Des ajustements dans les paramètres du binning et l’investigation d’autres logiciels seront nécessaires afin d’obtenir de meilleurs résultats pour les métagénomes d’A. vulgare. Par exemple l’utilisation de logiciels se basant uniquement sur la couverture des contigs tel que Canopy (Nielsen et al., 2014) pourraient permettre d’obtenir de nouveaux bins. Un nouvel assemblage en fusionnant l’ensemble des échantillons d’A. vulgare aiderait également à créer de nouveaux bins en augmentant la profondeur des lectures pour faciliter et améliorer l’assemblage des contigs.

Les résultats du binning reflètent les taxas les plus abondants des microbiotes, et sont consistants avec les prédictions faites par Kraken (Figure 26). Les bins classés parmi les Mollicutes dans les échantillons d’A. aquaticus prélevés dans la nature et P. d. dilatatus appartiennent probablement à des bactéries du genre Candidatus Hepatoplasma. La plupart des bins affiliés aux Rickettsiales dans les échantillons de P. pruinosus pourraient être des

Wolbachia, une bactérie abondante chez cette espèce d’après Kraken. Kraken a identifié de

nombreuses Vibrio dans la population naturelle de P. pruinosus et chez P. d. dilatatus, et plusieurs bins ont été affiliés à des Vibrionaceae dans ces échantillons, appuyant ainsi la méthode de binning utilisée.

Chapitre 3

176

Tableau 3. Statistiques des bins dont la complétude est supérieure à 80% et la contamination inférieure à 5%.

Sp. hôte Population Sexe Tissus Taxon Complétude (%) Contamination (%) Taille (pb)

(pb)

#contigs N50 Contig le plus long (pb) GC (%)

A. aquaticus Lab M Tube digestif Deltaproteobacteria 97,10 0,60 3 815 846 411 13 046 52 799 63,72

Lab M Tube digestif Bacteria 98,53 1,84 3 086 643 350 13 048 82 842 40,92 Lab M Tube digestif Proteobacteria 97,38 0,05 3 501 997 324 15 951 84 713 67,56 Nature F Tissus nd.* Burkholderiales 90,18 1,98 4 134 124 559 10 136 52 760 67,15 Nature F Tissus nd.* Cytophagales 80,22 2,98 2 761 966 789 3 918 20 559 35,31 Nature M Caeca Mollicutes 91,23 1,50 624 539 16 58 338 107 498 24,25 Nature M Tube digestif Mollicutes 88,72 0,75 570 422 57 17 064 40 703 24,38

P. d. dilatatus Lab M Caeca Mollicutes 82,66 1,38 566 088 66 11 787 28 532 22,08

Lab M Tube digestif Vibrionaceae 89,61 0,42 3 030 256 71 60 161 252 320 41,59

P. d. petiti Lab F Caeca Bacteria 90,11 1,10 1 247 320 22 144 548 208 105 29,45

Lab F Tube digestif Pseudomonadales 86,28 4,05 4 050 951 947 4 994 20 094 55,16 Lab M Caeca Mollicutes 84,06 2,21 563 123 41 20 665 52 593 22,65

P. pruinosus Lab F Caeca Rhizobiaceae 96,59 1,77 7 189 089 136 87 432 249 803 62,38

Lab F Caeca Rickettsiales 98,08 1,07 1 265 212 67 44 924 171 147 33,90 Lab F Caeca Rickettsiales 86,32 1,28 1 001 210 90 18 752 66 217 31,92 Lab F Tissus nd.* Rhizobiales 87,73 0,77 4 108 138 728 7 411 47 942 60,03 Lab F Tissus nd.* Rickettsiales 98,08 1,07 1 205 094 50 44 924 171 147 33,92 Lab F Tissus nd.* Rickettsiales 86,32 1,28 1 001 730 91 18 752 48 326 31,89 Lab F Tube digestif Rickettsiales 98,08 1,07 1 185 612 48 44 620 171 147 33,90 Lab F Tube digestif Rickettsiales 86,32 1,28 1 021 971 95 18 748 66 217 31,95 Lab M Caeca Rickettsiales 98,08 1,07 1 248 246 59 50 005 171 147 33,89 Lab M Caeca Rickettsiales 86,32 1,28 1 014 203 95 18 715 51 855 31,93 Lab M Tissus nd.* Rhodobacteraceae 91,91 1,69 3 221 372 458 9 360 42 977 53,90 Lab M Tissus nd.* Rhizobiales 98,36 0,58 4 236 886 302 22 406 71 665 60,09 Lab M Tissus nd.* Rickettsiales 98,08 1,07 1 220 819 48 61 923 169 441 33,94 Lab M Tube digestif Rickettsiales 97,65 1,07 1 222 485 59 42 471 171 147 33,96 Lab M Tube digestif Rickettsiales 85,25 1,71 1 036 266 120 13 750 52 370 31,99 Nature F Caeca Vibrionaceae 95,21 1,53 3 609 872 101 51 794 211 213 42,94 Nature F Caeca Vibrionaceae 94,87 0,95 3 553 418 83 74 214 187 644 41,73

177 Nature F Caeca Bacteria 86,81 1,10 1 101 123 22 111 397 213 247 29,62 Nature F Caeca Rickettsiales 95,51 1,07 1 187 180 43 44 924 171 147 33,94 Nature F Caeca Rickettsiales 86,32 3,85 1 106 711 109 18 715 66 217 32,17 Nature F Tissus nd.* Rickettsiales 98,08 1,07 1 241 861 55 63 430 171 147 33,93 Nature F Tissus nd.* Rickettsiales 90,53 1,42 1 069 240 170 8 279 37 665 32,05 Nature F Tube digestif Enterobacteriaceae 98,06 1,04 4 938 744 265 31 357 134 563 55,30 Nature F Tube digestif Vibrionaceae 89,77 1,85 3 394 294 110 51 668 188 271 43,06 Nature F Tube digestif Bacteria 86,81 1,10 1 112 020 21 114 440 207 256 29,57 Nature F Tube digestif Pseudomonadales 95,77 2,94 3 990 124 512 10 807 88 482 64,08 Nature F Tube digestif Rickettsiales 98,08 1,07 1 241 707 51 55 245 171 219 33,94 Nature M Caeca Rickettsiales 98,08 1,07 1 260 382 56 60 699 148 975 34,00 Nature M Caeca Rickettsiales 86,32 1,28 1 037 634 98 18 752 51 856 32,00 Nature M Tissus nd.* Rickettsiales 98,08 1,50 1 226 683 51 44 924 165 435 33,94 Nature M Tube digestif Vibrionaceae 93,44 1,63 3 474 615 302 17 882 67 746 41,71 Nature M Tube digestif Bacteria 92,31 1,10 1 125 901 90 20 567 76 400 29,45 Nature M Tube digestif Rickettsiales 98,08 1,07 1 223 736 48 52 923 171 147 33,95

Chapitre 3

178

Figure 27. Statistiques des 180 bins extraits des métagénomes. Les trois axes indiquent le pourcentage de contamination, de complétude et la taille du bin. Chaque point représente un bin et l’échelle de couleur est en fonction de la taille du bin.

Assemblage de génomes bactériens à partir des métagénomes

Les résultats suivants présentent les MAGs de quatre bactéries de genre différent identifiées dans les bins : Vibrio (Vibrionaceae), Candidatus Hepatoplasma (Mollicutes),

Candidatus Hepatincola (Rickettsiales) et Wolbachia (Rickettsiales). Nous nous sommes

concentrés en premier lieu sur les MAGs de ces bactéries du fait de leur ubiquité chez les isopodes ; les autres MAGs seront analysés à la suite de cette thèse. Plusieurs bins étaient susceptibles de constituer des MAGs de bonne qualité pour ces quatre taxa bactériens (Tableau 3). Dans le but d’obtenir le meilleur MAG possible pour chacun de ces taxa, nous avons sélectionné les bins candidats en prenant ceux qui ont (1) la meilleure complétude, (2) un taux de contamination proche de zéro, et ceux qui sont (3) le moins fragmentés avec (4) la meilleure N50. Après avoir vérifié l’affiliation taxonomique de chaque contig des bins sélectionnés, ils ont été réassemblés pour obtenir un MAG de meilleure qualité.

179 1) Vibrio

Le MAG de Vibrio a été assemblé à partir du bin de Vibrionaceae de P. d. dilatatus (Tableau 3). Parmi les 390 contigs obtenus (Tableau 4), 97 ont été affiliés au genre

Vibrio par CAT-BAT. La taille estimée du génome (3Mb) est plus petite que celle

observée en moyenne pour les génomes de Vibrio référencés sur GenBank (entre 4 et 5Mb). L’absence de 42 gènes orthologues universels aux Gamaproteobacteria (Tableau 5) suggère que le génome n’est pas complet. Le génome est composé de beaucoup de gènes dont la fonction est inconnue (Tableau 6, Figure 28). Le répertoire enzymatique du MAG de Vibrio se compose de 35 CAZymes (Tableau 6), dont huit sont relatives à la dégradation de la lignocellulose : AA1, AA2, AA3, CE4, GH1, GH3, GH43, GH6. Hotpep a permis l’identification de deux fonctions enzymatiques en lien avec la