HAL Id: tel-01124109
https://tel.archives-ouvertes.fr/tel-01124109
Submitted on 6 Mar 2015
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Caractérisation de flores microbiennes intestinale humaine et fromagère par méthode de métagénomique
quantative
Mathieu Almeida
To cite this version:
Mathieu Almeida. Caractérisation de flores microbiennes intestinale humaine et fromagère par méth- ode de métagénomique quantative. Sciences agricoles. Université Paris Sud - Paris XI, 2013. Français.
�NNT : 2013PA112076�. �tel-01124109�
Université Paris Sud XI Orsay
Ecole doctorale Gènes Génomes Cellules
Thèse de doctorat en Sciences de la Vie
Caractérisation de flores microbiennes intestinale humaine et fromagère par méthode de métagénomique quantitative
Mathieu Almeida
Présentée et soutenue publiquement le 7 juin 2013
Composition du Jury :
Mr Pierre Capy Président
Mme Claudine Médigue Rapporteur
Mr Mihai Pop Rapporteur
Mr Johan van Hylckama Vlieg Examinateur
Mr Emmanuel Jamet Examinateur
Mr Stanislav Dusko Ehrlich Co-directeur de thèse
Mr Pierre Renault Directeur de thèse
Thèse Mathieu Almeida - Caractérisation de flores microbiennes… 2013
2
Thèse Mathieu Almeida - Caractérisation de flores microbiennes… 2013
3
R EMERCIEMENTS
Je voudrais commencer ce manuscrit en remerciant toutes les personnes que j’ai croisé durant ces 4 années à l’INRA de Jouy-en-Josas, qui ont rendu possible ce travail et qui me sont cher. J’ai eu la chance de côtoyer tous les jours des personnes formidables, je voudrais leur exprimer ma fierté et ma gratitude pour tous les moments partagés avec eux. Ces années font partie des plus belles de ma vie, je voudrais les en remercier :
Je remercie tout d’abord mon directeur de thèse Pierre Renault, pour m’avoir accueilli au sein de son équipe, pour son soutien, sa gentillesse et sa patience. Tu m’as donné l’envie de réaliser une thèse, et m’a aidé toutes ces années pour que ce travail puisse se réaliser, je ne te remercierai jamais assez pour cela.
Je remercie mon co-directeur de thèse Dusko Ehrlich pour m’avoir donné la chance de participer au projet MetaHIT et m’avoir conseillé toutes ces années. Je n’oublierai jamais les conférences et les discussions au sein de ce consortium. Je te remercie pour m’avoir accordé ta confiance, c’est aussi grâce à toi que j’en suis arrivé là.
J’adresse mes sincères remerciements à mes rapporteurs de thèse Mr Mihai Pop et Mme Claudine Médigue, qui ont accepté de lire ce manuscrit de thèse. De même, je remercie Monsieur Johan van Hylckama Vlieg, Monsieur Emmanuel Jamet et Monsieur Pierre Capy qui ont accepté de participer à mon jury de thèse.
Je remercie Jean-Michel Batto pour m’avoir aidé tout au long de ces années. Tu as été une des personnes qui m’a accordé le plus de soutien professionnel et moral, je ne te remercierai jamais assez pour cela.
Je remercie Nicolas Pons, mon mentor et exemple tant au niveau professionnel qu’humain. Je te souhaite tout le bonheur du monde, tu le mérites largement.
Je remercie chaleureusement Edi et Emmanuelle pour leur soutien, gentillesse et leur aide précieuse pour rendre ce manuscrit plus agréable à lire.
Je remercie toute l’ex GM que l’on appelle maintenant MICALIS, et plus particulièrement Christine, Eric, Céline, Anne-Laure, Nicolas S. J’ai beaucoup appris à vos côtés, moi qui n’y connaissais rien en microbiologie, vous m’avez transmis votre passion pour cette science.
Je remercie également toute l’équipe de la prépa : Christophe, Cindy, Véronique, et Ludovic pour leur gentillesse, soutien et bonne humeur.
Je remercie tous les collègues du projet MetaHIT, et plus particulièrement Agnieszka, Bjørn et Simon du CBS pour m’avoir accueilli quelques semaines dans leur équipe si chaleureusement.
Je remercie tous les collègues du projet Food-Microbiomes, et plus particulièrement Yves Brygoo, Françoise Irlinger, Christophe Monnet, Agnès Hébert, Marie-Christine Montel, et Céline Délbès.
Vous m’avez introduit dans le monde passionnant des produits fermentés alimentaires, j’espère encore avoir l’occasion de partager votre expérience dans ce domaine.
Je remercie toute l’équipe MGP et plus particulièrement Sean, Benoit, Nathalie, Florence, Julien et
Célia. C’était formidable de pouvoir découvrir avec vous le potentiel des séquenceurs hauts-débits.
Thèse Mathieu Almeida - Caractérisation de flores microbiennes… 2013
4
Je remercie toute l’équipe Enterome et plus particulièrement Matthieu pour sa gentillesse, son professionnalisme et ses conseils avisés.
Je remercie mes collègues et amis Kévin, Emna, Florian, Ludovic et Séverine et plus particulièrement Victoria, Hela, Bouziane et Victor. Vous m’avez toujours soutenu, même dans les moments les plus difficiles de la thèse.
Je tiens à remercier les personnes qui m’ont aidé pendant ces années, dans mon travail comme dans ma vie personnelle. Je tiens à les remercier tout particulièrement, car elles ont joué un grand rôle dans ma vie et ont contribué indirectement à ce travail. Je n’oublierai jamais ces moments de ma vie avec elles. J’espère qu’elles se reconnaîtront.
Finalement, je remercie ma famille, mes parents, mon frère et ma sœur pour leur amour et leur
soutien. Vous êtes mes exemples, ma fierté. Je vous dédie ce travail, en espérant vous rendre aussi fier
que je le suis de vous.
Thèse Mathieu Almeida - Caractérisation de flores microbiennes… 2013
5
R ÉSUMÉ
La flore microbienne est un ensemble de micro-organismes comme les bactéries, archées, eucaryotes et virus, jouant un rôle important dans l’équilibre d’un écosystème. Cette flore reste encore mal définie car en 2012, seules ~30% des micro-organismes de la flore intestinale humaine étaient caractérisés, et moins de 50% des micro-organismes de la flore fromagère traditionnelle étaient caractérisés au niveau fonctionnel. Depuis 2006, les séquenceurs à ADN de seconde génération permettent d’analyser directement le contenu génique d’un prélèvement de flore sans contrainte d’isolement ou de culture. Toutefois, les séquences d’ADN générées ne sont pas structurées en génome et sont hautement fragmentées, freinant considérablement l’analyse et l’exploitation de ces données.
Dans ce travail, nous avons développé de nouvelles méthodes dites de métagénomiques quantitatives, car elles permettent de regrouper les courtes séquences d’ADN ayant la même abondance au sein de plusieurs échantillons métagénomiques, pouvant provenir d’une même espèce microbienne.
Au niveau du microbiote intestinal humain, nous avons structuré un catalogue de 3,9 millions de gènes de la flore intestinale humaine en 741 unités ou « clusters » correspondant à des génomes de bactéries, d’archées et d’eucaryotes, que nous appelons espèces métagénomiques (MGS) et 6640 unités correspondant principalement à des génomes de virus, plasmides et divers ilots génomiques comme des CRISPR, que nous appelons unités métagénomiques (MGU). Cette méthode de structuration a ensuite été utilisée pour faciliter des analyses d’associations de la composition de la flore intestinale avec des maladies humaines comme la maladie de Crohn, l’obésité ou le diabète de type 2. Enfin, au niveau des flores alimentaires, nos méthodes ont été utilisées pour constituer un catalogue de 134 génomes d’espèces bactériennes fromagères et caractériser la flore de surface de fromages traditionnels. Ceci nous a permis de détecter la présence de nouvelles bactéries alimentaires, pouvant enrichir la liste des bactéries à possible intérêt technologique dans les produits laitiers fermentés.
Mots clés : métagénomique quantitative, clustering, flore intestinale humaine, flore
fromagère.
Thèse Mathieu Almeida - Caractérisation de flores microbiennes… 2013
6
S UMMARY
The microbial flora is a micro-organism complex such as bacteria, archaea, eukaryota and viruses, playing an important role in ecoystem equilibrium. This flora still stay poorly defined because in 2012, only ~30% of the intestinal flora micro-organisms were characterized, and less than 50% of traditional cheese floras were characterized at functional level. Since 2006, the second generation DNA sequencers allow to analyze directly the genetic content from a flora sample without isolation or culture limitation. However, the DNA reads generated are not structured in genome and highly fragmented, slowing down dramatically the exploitation and analyse of those data.
In this work, we developed new methods called quantitative metagenomic methods, because they allowed the clustering of short DNA sequences following the same abundance in multiple metagenomic samples, which should come from the same microbial species.
In the human intestinal microbiota, we have structured a 3.9 million gene catalog build from the human intestinal tract into 741 units or clusters corresponding to bacteria, archaea and eukaryote genomes, that we call metagenomic species (MGS) and 6640 units corresdponding mainly to viruses genomes, plasmids and genetic islands like CRISPR, that we call metagenomic units (MGU). This structuration method was then used to facilitate the association analysis of the intestinal flora composition with human disease such as Crohn disease, obesity or type 2 diabetes. Finally, in the alimentary flora, our methods were used to constitute a 134 genomic catalog of cheese bacteria and characterize the flora of traditional cheeses surface. This allowed to detect the presence of new alimentary bacteria, that can enriched the list of bacteria with possible technologic interest in fermented products.
Keywords : quantitative metagenomics, clustering, human intestinal flora, cheese flora.
Thèse Mathieu Almeida - Caractérisation de flores microbiennes… 2013
7
L EXIQUE
core-genome: ensemble des gènes conservés au sein de toutes les souches d’une même espèce.
cluster: regroupement de plusieurs objets partageant une ou plusieurs propriétés.
clustering: ou structuration, procédure de regroupement d’objets en cluster.
contig: chevauchement de plusieurs séquences provenant de séquenceur à ADN créant une séquence ADN consensus contigüe.
CRISPR : motif de quelques nucléotides de taille (de 24 à 48 nucléotides) localisé dans le génome des bactéries et archées, jouant un rôle protecteur contre des invasions de phages ou plasmides.
draft génomique: assemblage incomplet d’un génome en fragments génomiques.
flore microbienne: ensemble des micro-organismes présents au sein d’un écosystème.
k-mer : mot de taille k nucléotides, utilisé comme paramètre dans les outils d’assemblage génomique.
métagénomique: ensemble des fragments génomiques provenant de tous les organismes d’un écosystème.
métagénomique quantitative: abondance relative des fragments génomiques provenant de tous les organismes d’un écosystème.
MGU (MetaGenomic Unit) ou unité métagénomique: cluster de fragments génomiques ayant la même abondance au sein de plusieurs échantillons.
MGS (MetaGenomic Species) ou espèces métagénomiques: cluster de fragments génomiques correspondant à une ou plusieurs souches d’une ou plusieurs espèces ayant la même abondance au sein de plusieurs échantillons.
contig/scaffold N50: la plus grande longueur contenant au moins la moitié de la somme cumulée des fragments d’un assemblage. Proche de la valeur médiane des longueurs, en apportant plus de poids aux plus longs fragments.
séquence paired-end: courtes séquences d’ADN jointes en une séquence dont seul les nucléotides des extrémités sont déterminée. L’espacement entre les deux séquences appelé insert n’est donc pas déterminé mais de taille connue.
scaffold: jointure de deux contigs de distance connue, non définie au niveau de la composition en nucléotide.
shotgun sequencing: séquençage global aléatoire d’un ou plusieurs fragments d’ADN.
pan-genome: ensemble des gènes détectés au sein de toutes les souches d’une même espèce
Thèse Mathieu Almeida - Caractérisation de flores microbiennes… 2013
8
Table des matières
AVANT PROPOS ... 12
INTRODUCTION ... 15
I CARACTERISATION DES MICRO-ORGANISMES PAR METHODES CULTURES DEPENDANTES. ... 16
I.1 C
ARACTERISATION PHENOTYPIQUE... 16
I.1.1 Le microscope optique et les premières classifications des micro-organismes. ... 16
I.1.2 Le microscope électronique et la découverte des virus. ... 16
I.1.3 Le microscope électronique à rayon X et la découverte de la structure de l’ADN. ... 17
I.2 C
ARACTERISATION GENOTYPIQUE... 18
I.2.1 Les premiers séquençages de l’ARN et l’ADN et la classification phylogénétique ... 18
I.2.2 Du séquençage de l’ADN vers la caractérisation des gènes. ... 19
I.2.3 Les séquenceurs à ADN automatisés et le premier génome bactérien complet. ... 20
I.2.4 Le déluge de génomes bactériens complets par utilisation des séquenceurs multi-capillaires et la définition des concepts de « pan » et « core-genome ». ... 20
I.2.5 Le séquençage de marqueurs phylogénétiques et l’arbre de la vie ... 22
I.3 C
ARACTERISATION DES FLORES PAR METHODES CULTURES DEPENDANTES:
AVANTAGES ET LIMITES... 23
II CARACTERISATION DES MICRO-ORGANISMES PAR DES METHODES METAGENOMIQUES CULTURES INDEPENDANTES. ... 23
II.1 L
A METAGENOMIQUE ET LES GRANDES ETAPES DE CARACTERISATION D’
ECHANTILLONS METAGENOMIQUES PAR METHODES CULTURES INDEPENDANTES... 23
II.2 S
EQUENÇAGE D’
ECHANTILLONS METAGENOMIQUES... 25
II.2.1 Séquençage par amplification dirigée des régions ADNr 16S ... 25
II.2.2 Séquençage aléatoire de l’ADN de l’échantillon métagénomique ... 26
II.3 T
RAITEMENTS BIOINFORMATIQUES DE CARACTERISATION DES COURTES SEQUENCES D’ADN
METAGENOMIQUES. ... 27
II.3.1 Méthodes de caractérisation par alignement des séquences sur référence connue ... 28
II.3.2 Méthodes de caractérisation par assemblage des courtes séquences en catalogue de référence ... 29
II.3.3 Méthodes d’assignation des espèces microbiennes par clustering ... 30
II.4 A
VANTAGES ET LIMITES DES METHODES DE CARACTERISATION PAR METHODES CULTURES INDEPENDANTES... 34
METHODES ET RESULTATS ... 36
III RECONSTRUCTION DE GENOMES A PARTIR D’UN CATALOGUE DE GENES DE LA FLORE INTESTINALE HUMAINE. DEFINITION DES UNITES ET ESPECES METAGENOMIQUES. ... 37
III.1 É
TAT DE L’
ART ET PROBLEMATIQUE... 37
III.1.1 La flore intestinale : une flore hautement complexe et peu caractérisée ... 37
III.1.2 Les séquenceurs de seconde génération et le catalogue de gène MetaHIT. ... 37
III.1.3 Nécessité de développer une méthode de regroupement et d’analyse des dépendances entre micro- organismes adaptée aux catalogues de gènes complexes... 38
III.2 A
RTICLE: D
EPENDENCIES AMONG METAGENOMIC SPECIES,
VIRUSES,
PLASMIDS AND UNITS OF GENETIC VARIATION. ... 39
III.3 D
EVELOPPEMENT METHODOLOGIQUE... 59
III.3.1 Méthode de regroupement par co-abondance ... 59
III.3.2 Comparaison des résultats des deux méthodes ... 62
III.3.4 Présentation des unités et espèces métagenomiques ... 65
III.3.5 Utilisation d’une chaîne de réassemblage optimisé des MGS en assemblage génomique de haute qualité ... 66
III.3.6 Classification des individus en Enterotype ... 68
III.4 D
ISCUSSION SUR LA CLASSIFICATION D’
UN CATALOGUE METAGENOMIQUE ENMGU
ETMGS ... 69
Thèse Mathieu Almeida - Caractérisation de flores microbiennes… 2013
9
III.4.1 Identification et reconstruction de génomes d’espèces connues et inconnues directement à partir
d’échantillons métagénomiques ... 69
III.4.2 Découverte de nouvelles branches phylogénétiques et de génomes atypiques. ... 70
III.4.3 La liste des espèces les plus présentes dans la flore intestinale ... 71
III.4.4 Les MGS facilitent l’étude d’association entre l’obésité, l’inflammation intestinale et la composition de la flore intestinale chez 292 individus danois ... 73
III.4.5 Les MGS facilitent l’étude de l’effet d’un régime alimentaire sur la composition de flore microbienne au cours du temps chez 49 individus obèses français ... 76
IV CONSTRUCTION D’UN CATALOGUE GENOMIQUE ALIMENTAIRE DE REFERENCE ET APPLICATION A LA CARACTERISATION DE FROMAGES TRADITIONNELS. ... 80
IV.1 L
ES PRODUITS LAITIERS FERMENTES:
UNE FLORE TRES ETUDIEE MAIS ENCORE PEU CARACTERISEE... 80
IV.2 B
ESOIN D’
ETABLIR UNE BASE DE DONNEES DE REFERENCE DE GENOMES ALIMENTAIRES... 80
IV.3 A
RTICLE: C
ONSTRUCTION OF A FOOD MICROBIAL GENOME CATALOGUE,
AND FIRST APPLICATION TO CHEESE ECOSYSTEM. ... 81
IV.4 D
EVELOPPEMENT METHODOLOGIQUE... 102
IV.4.1 Création d’une banque de référence de génomes alimentaires ... 102
IV.4.2 Réassemblage optimisé des clusters de fragment en assemblages génomiques ... 109
IV.4.3 Qualité des assemblages génomiques ... 110
IV.4.4 Assignation phylogénétique des génomes ... 111
IV.5 D
ISCUSSION SUR LA CREATION D’
UN CATALOGUE DE GENOMES ALIMENTAIRES... 114
IV.5.1 Une nouvelle méthode de clustering pour reconstruire des génomes bactériens ... 114
IV.5.2 Création d’un catalogue alimentaire représentatif de la diversité bactérienne ... 114
IV.5.4 Détection d’événements biologiques d’adaptation de bactérie commensale ou environnementales à des milieux alimentaires ... 114
IV.5.5 Première caractérisation fonctionnelle de l’écosystème fromager. ... 115
CONCLUSIONS ET PERSPECTIVES ... 116
V CONCLUSIONS ET PERSPECTIVES ... 117
V.1 A
PPORT DU TRAVAIL AU SEIN DE LA COMMUNAUTE... 117
V.1.1 Une méthode de regroupement adaptée aux données métagénomiques complexes et simples ... 117
V.1.2 Un élargissement des bases de données génomique de références ... 118
V.2 A
IDER A LA CARACTERISATION ET L’
ISOLEMENT DE NOUVEAUX ORGANISMES D’
INTERET... 119
V.3 A
PPLIQUER LA METHODE DE REGROUPEMENT DE MATRICE DE COMPTAGE A D’
AUTRES ECOSYSTEMES OU D’
AUTRES TYPES DE DONNEES... 119
V.4
UTILISER LES INFORMATIONS DE DEPENDANCES ENTRE UNITES ET ESPECES METAGENOMIQUES POUR CARACTERISER LES FONCTIONS DES ECOSYSTEMES... 120
V.5 D
EFINIR DE NOUVEAUX MARQUEURS DE DIAGNOSTIQUE DE SANTE HUMAINE OU DE PROPRIETE ORGANOLEPTIQUE DANS LES ALIMENTS... 120
PUBLICATIONS ... 121
REFERENCES ... 123
ANNEXES ... 127
A
NNEXE1 : D
ONNEES SUPPLEMENTAIRES ARTICLE FLORE INTESTINALE... 127
A
NNEXE2 : D
ONNEES SUPPLEMENTAIRES ARTICLE FLORE ALIMENTAIRE... 152
A
NNEXE3 : W
ORDLE GRAPHIQUE DES OCCURRENCES DES MOTS AU SEIN DU MANUSCRIT DE THESE... 164
Thèse Mathieu Almeida - Caractérisation de flores microbiennes… 2013
10
T ABLE DES FIGURES
F
IGURE1: C
ARACTERISATION BACTERIENNE PAR COLORATION DEG
RAM ET MICROSCOPIE OPTIQUE. ... 16
F
IGURE2: O
BSERVATION D’
UN VIRUS PAR MICROSCOPIE ELECTRONIQUE. ... 17
F
IGURE3: C
ARACTERISATION DE LA STRUCTURE EN DOUBLE HELICE DE L’ADN
PAR MICROSCOPIE ELECTRONIQUE A RAYONX. ... 18
F
IGURE4: L
ECTURE DE LA SEQUENCE EN NUCLEOTIDES D’
UN FRAGMENT D’ADN
APRES SEQUENÇAGE PAR LA METHODES
ANGER. .... 19
F
IGURE5: G
RAPHIQUE DE L’
EVOLUTION DU NOMBRE DE GENOMES COMPLETS SEQUENCES SOUMIS A LA BANQUE DE DONNEESG
ENBANK AU COURS DU TEMPS. ... 21
F
IGURE6: C
ARACTERISATION PHYLOGENETIQUE DU VIVANT PAR CREATION D’
UN ARBRE PHYLOGENETIQUE UTILISANT31
PROTEINES MARQUEURS. ... 22
F
IGURE7: S
CHEMA REPRESENTANT LES ETAPES PRINCIPALES DES METHODES DE CARACTERISATION DITES CULTURE INDEPENDANTES. 24 F
IGURE8: S
CHEMA PRESENTANT LA STRUCTURE DE L’ADN
R16S. ... 25
F
IGURE9: S
CHEMA DES ETAPES D’
UN SEQUENÇAGE454 FLX T
ITANIUM PAR AMPLIFICATION DIRIGEE. ... 26
F
IGURE10: E
TAPES DE SEQUENÇAGE SUR MACHINESOL
ID 5500
WILDFIRE(
EN HAUT)
ETI
LLUMINAH
ISEQ2000 (
EN BAS). ... 27
F
IGURE11: E
XEMPLE DE VISUALISATION DE COURTES SEQUENCES ALIGNEES SUR UNE REFERENCE AVEC L’
OUTILT
ABLET. ... 28
F
IGURE12: L
ES DIFFERENTES ETAPES DE RECONSTITUTION DU CATALOGUE DE REFERENCEM
ETAHIT. ... 29
F
IGURE13: M
ETHODE D’
ASSIGNATION TAXONOMIQUE PAR CHOIX DE L’
ANCETRE COMMUN MINIMAL DANSMEGAN. ... 31
F
IGURE14: I
LLUSTRATION DE LA VISUALISATION D’
UNE SEQUENCE D’ADN
SOUS FORME DE FREQUENCES DE TETRANUCLEOTIDE... 32
F
IGURE15: C
HAINE DE TRAITEMENT DE CLUSTERING PAR LA METHODEA
BUNDANCEB
IN. ... 33
F
IGURE16: E
XEMPLE DE MATRICE DE COMPTAGE DU CATALOGUE DE GENESM
ETAHIT. ... 59
F
IGURE17: C
HAINE DE TRAITEMENT DE REGROUPEMENT DES3,9
MILLIONS DE GENES DU CATALOGUEM
ETAHIT
PAR LA METHODE DE REGROUPEMENT HIERACHIQUE. ... 60
F
IGURE18: S
CHEMA DES ETAPES DE REGROUPEMENT DANS L’
OUTIL POST_
METAPROF. ... 61
F
IGURE19: H
ISTOGRAMME DE LA CORRELATION MEDIANEP
EARSON DES CLUSTERS DANS UN JEU DE DONNEES INDEPENDANT. ... 64
F
IGURE20: D
ISTRIBUTION DU NOMBRE DE GENE AU SEIN DE GENOMES PROCARYOTES COMPLET. ... 65
F
IGURE21: E
TAPES DE REASSEMBLAGE OPTIMISE DES UNITES METAGENOMIQUES EN ASSEMBLAGE GENOMIQUE. ... 66
F
IGURE22: D
OTPLOT DE L’
ALIGNEMENT ENTRE LE GENOME COMPLETB
IFIDOBACTERIUM ANIMALISCNCM I-2494
ET LE GENOME RECONSTITUE DE LAMGS B
IFIDOBACTERIUM ANIMALIS CHEZ UN INDIVIDU DU PROJETM
ETAHIT. ... 67
F
IGURE23: H
ISTOGRAMME DU POURCENTAGE DE GENES ESSENTIELS DETECTES DANS LES ASSEMBLAGES GENOMIQUES. ... 68
F
IGURE24: G
RAPHE DES SCORESAUC
DE CHAQUE MODELE DE PREDICTION DE L’
ETAT D’
OBESITE. ... 75
F
IGURE25: D
ISTRIBUTION DU NOMBRE DE GENES DETECTES AU SEIN DE LA FLORE INTESTINALE DE123
INDIVIDUS NON-
OBESE ET169
INDIVIDUS OBESES. ... 75
F
IGURE26: D
ISTRIBUTION DU NOMBRE DE GENE AU SEIN DE49
INDIVIDUS OBESES OU EN SURPOIDS,
A T0,
T6
ET T12. ... 78
F
IGURE27: D
ISTRIBUTION DES VALEURSAUC
DE PREDICTION DE L’
ETAT DE FAIBLE DIVERSITE CHEZ DES INDIVIDUS FRANÇAIS OU DANOIS. ... 79
F
IGURE28: P
RESENTATION DE LA METHODE DE REGROUPEMENT DERIVEE DE LA METHODEC
ANOPY. ... 108
F
IGURE29: D
OTPLOT D’
ALIGNEMENT NUCLEOTIDIQUE LOCAL ENTRE LA REFERENCE COMPLETEA
RTHROBACTER ARILAITENSISR
E117
DISPONIBLE SURNCBI
ET L’
ASSEMBLAGEA
RTHROBACTER ARILAITENSISR
E117
RECONSTITUE AU SEIN D’
UN POOL DE30
GENOMES. ... 110
F
IGURE30: A
RBRE PHYLOGENIQUE CENTRE SUR LA REGION CONTENANT LE GENOMEA
EROCOCCUS VIRIDANSTL327A. ... 111
F
IGURE31: H
EATMAP DE LA COMPOSITION EN TETRANUCLEOTIDE DES562
FRAGMENTS DE PLUS DE2
KB DU CLUSTERA
EROCOCCUS. ... 113
F
IGURE32 : P
RESENTATION DE L’
INTERFACE DE REGROUPEMENT DE L’
OUTILMETEOR. ... 117
Thèse Mathieu Almeida - Caractérisation de flores microbiennes… 2013
11
T ABLE DES TABLES
T
ABLEAU1 : F
REQUENCE DE QUELQUES GENRES PROCARYOTES IDENTIFIEES AU SEIN DES5
PREMIERS INDIVIDUS DU PROJETM
ETAHIT.
... 69 T
ABLEAU2 : P
RESENTATION DES31 MGS
VUES DANS AU MOINS90%
DES ECHANTILLONS. ... 72 T
ABLEAU3 : T
AXONOMIE DES CLUSTERS SIGNIFICATIVEMENT PLUS ABONDANTS CHEZ LES OBESES OU LES MAIGRES(
TESTW
ILCOXON,
P
<0,05). ... 74 T
ABLEAU4 : P
RESENTATION DES26
CLUSTERS DONT L’
ABONDANCE EST SIGNIFICATIVEMENT DYNAMIQUE AU COURS DU REGIME. ... 77 T
ABLEAU5: D
ETAIL DU NOMBRE DE CONTIGS DANS LES5
POOLS D'
ASSEMBLAGE DE LA FLORE ALIMENTAIRE. ... 102 T
ABLEAU6 : M
ATRICE DE SIGNATURE DE PRESENCE ET ABSENCE DES SOUCHES,
DANS LES6
POOLSSOL
ID. ... 106 T
ABLEAU7 : C
OUVERTURE DE QUELQUES FRAGMENTS D’ADN
DU POOLI
LLUMINA1. ... 107 T
ABLEAU8: S
TATISTIQUES DES TAILLES DES ASSEMBLAGES AVANT ET APRES LA PROCEDURE DE REASSEMBLAGE ASSISTE PAR UNEREFERENCE PROCHE