• Aucun résultat trouvé

5. Compendium du microbiote intestinal humain

5.5 Prévalence et abondance des MSPs

La majorité des MSPs sont rares car elles sont détectées dans peu d’échantillons ce qui est cohérent avec les observations faites pour les gènes (page 31). 596 MSPs (35,9%) sont détectées dans moins de 1% des échantillons et 1110 (66,2%) dans moins de 5%. Seules 82 MSPs (4,9%) ont une prévalence supérieure à 50% montrant que le core microbien de l’intestin humain est limité à quelques dizaines d'espèces (Tableau 10). Parmi ces 82 MSPs, 28 ne sont pas annotées au niveau espèce. Ceci montre que des espèces prévalentes n’ont pas encore été séquencées à ce jour malgré les progrès des techniques de culture microbienne. Fait intéressant, aucune MSP n’est détectée dans tous les

70

échantillons probablement à cause de la taille importante de la cohorte et de la grande diversité de phénotypes.

msp Annotation taxonomique Prévalence dans les 1267 échantillons du

catalogue IGC

Abondance moyenne dans les échantillons où le core de la MSP est détecté (%) msp_0071 Bacteroides vulgatus 97,5% (1 235) 7,3% msp_0044 Bacteroides uniformis 94,0% (1 191) 4,1% msp_0079 Blautia wexlerae 93,8% (1 189) 0,9% msp_0011 Parabacteroides distasonis 89,3% (1 131) 1,3% msp_0204 Ruminococcus sp. Marseille-P328 86,9% (1 101) 0,2% msp_0113 Anaerostipes hadrus 86,1% (1 091) 0,6% msp_0489 Dorea formicigenerans 83,1% (1 053) 0,2% msp_0151 Fusicatenibacter saccharivorans 82,6% (1 047) 0,5%

msp_0452 Firmicutes non classifiée 80,4% (1 019) 0,2%

msp_0377 Odoribacter splanchnicus 80,3% (1 018) 0,4%

Tableau 10 : Liste des 10 MSPs les plus prévalentes dans les 1267 échantillons du catalogue IGC.

Nous n’avons pas trouvé de lien évident entre la prévalence d’une MSP et son abondance (Figure 36). Remarquablement, les deux MSPs correspondant à Bacteroides vulgatus et Bacteroides uniformis sont à la fois très prévalentes (détectées respectivement dans 97,5% et 94,0% des échantillons) et abondantes (abondances relatives moyennes de 7,3% et 4,1%). La MSP correspondant à Prevotella copri est quant à elle détectée que dans un tiers de la cohorte mais est très abondante lorsqu’elle est présente (abondance relative moyenne de 12,7%).

Figure 36 : Abondance moyenne des MSPs dans les échantillons où elles sont détectées en fonction de leur prévalence.

L’axe des abscisses représente le pourcentage d’échantillons du catalogue IGC où le core de la MSP est détecté. L’axe des ordonnées correspond à l’abondance moyenne de la MSP dans les échantillons où elle est présente (échelle log10). Les points rouge, bleu et vert correspondent respectivement aux MSPs associées à Bacteroides vulgatus, Bacteroides uniformis et Prevotella copri. La courbe bleue correspond à la courbe de tendance calculée avec un modèle additif généralisé (méthode GAM)

71 On note aussi la présence de MSPs très rares mais abondantes dans les échantillons où elles sont présentes (Tableau 11). Ces MSPs sont pour la plupart associées au genre Prevotella. Ainsi, il est important de prendre en considération les espèces rares lors des analyses car elles peuvent jouer un rôle significatif dans certains échantillons.

msp Annotation taxonomique

Prévalence dans les 1267 échantillons du

catalogue IGC

Abondance moyenne dans les échantillons

où le core de la MSP est détecté (%) msp_1524 unclassified Prevotella 0,32% (4) 9,63% msp_0989 Prevotella sp. CAG:1320 0,32% (4) 8,26% msp_1460 unclassified Prevotella 0,47% (6) 7,36% msp_0545 Prevotella sp. CAG:1124 0,63 (8) 6,28% msp_0744 Prevotella sp. CAG:1185 0,47 (6) 5,06%

Tableau 11 : Exemple de MSPs très rares mais abondantes dans les échantillons où elles sont détectées

Globalement, les MSPs annotées au niveau espèce sont détectées dans un plus grand nombre d’échantillons que les MSPs ayant une annotation moins précise (Figure 37.A). Ainsi, les espèces du microbiote intestinal humain séquencées à ce jour sont globalement les plus prévalentes. A contrario, nous n’avons pas trouvé de différence significative entre l’abondance des MSPs annotées au niveau espèce et celles qui ne le sont pas (Figure 37.B).

Figure 37 : Comparaison de la prévalence (à gauche) et de l’abondance (à droite) des MSPs annotées au niveau espèce (boxplots verts) et de celles qui ne le sont pas (boxplots rouges).

A.Les MSPs annotées au niveau espèce sont significativement plus prévalentes que celles qui ne le sont pas (prévalence médiane de 5,4% contre 1,7%, p-valeur=1,4.10-21 au test U de Mann-Whitney). Les MSPs avec une prévalence supérieure à 50% n’ont pas été représentées pour faciliter la lisibilité du graphique.

B.Il n’existe pas de différence significative entre l’abondance relative des MSPs annotées niveau espèce et celles qui ne le sont pas (abondance médiane de 0,21% contre 0,23%, p-valeur=0,21 au test U de Mann-Whitney). Seuls les échantillons où les gènes core des MSPs sont détectés ont été considérés pour le calcul de l’abondance. Les MSPs avec une abondance moyenne supérieure à 5% n’ont pas été représentées pour faciliter la lisibilité du graphique.

72

Nous avons aussi constaté que la prévalence des gènes dans une MSP suit souvent une distribution bimodale en U comme exposé en 1.1.1.4. Les gènes ont soit une prévalence élevée (gènes core + soft core) ou faible (gènes cloud) mais plus rarement intermédiaire (gènes shell) (Figure 38).

Finalement, on observe une forte corrélation entre la prévalence d’une MSP et son nombre de gènes accessoires (coefficient de corrélation de Spearman = 0.86, p-valeur = 0). Comme appréhendé dans la simulation, plus une MSP est détectée dans un nombre important d’échantillons, plus MSPminer récupère un nombre important de gènes accessoires et plus particulièrement les gènes rares (cloud) qui sont les plus nombreux.

Figure 38 : Prévalence des gènes de 3 MSPs dans les échantillons du catalogue IGC où leurs gènes core respectifs sont détectés.

Ces MSPs ont été sélectionnées car elles sont détectées dans un grand nombre d’échantillons ce qui augmente la probabilité d’y trouver des gènes accessoires rares. Pour chaque MSP, on représente sur l’axe des abscisses la prévalence du gène et en ordonnées la proportion de gènes ayant cette prévalence.

On met ainsi en évidence 4 catégories de gènes décrits par Koonin et Wolf [30] :

1.Cloud : gènes accessoires rares détectés dans une faible proportion d’échantillons où l’espèce est présente. Ici, la proportion de gènes cloud est sous-estimée car les plus rares ne vérifient pas le critère de sélection basé sur la co-occurrence.

2.Shell : gènes accessoires de prévalence intermédiaire

3.Soft core : gènes accessoires très prévalents présents dans quasiment tous les échantillons où l’espèce est présente.

4.(Hard) core : gènes présents dans tous les échantillons où l’espèce est présente.