• Aucun résultat trouvé

Après l’extraction des ARNm et l’envoi des échantillons au laboratoire de l’unité à Montpellier, les échantillons ont été confiés à la plateforme MGX pour la réalisation des banques de préparation au séquençage et le séquençage proprement dit, sur Illumina HiSeq 2000. J’ai donc récupéré les fichiers issus du séquençage produits par la plateforme, avec les fichiers fastq et leurs rapports de contrôle qualité, qui était excellents (cf. Annexe 6).

Le séquençage des ARN messagers des cellules sanguines des bovins et des trypanosomes (présents dans le compartiment sanguin lors de l’infection) a produit entre 28 et 70 millions de reads pour les 120 échantillons de l’étude. Le mapping avec STAR a permis d’obtenir 97 % de reads alignés sur les génomes (NB : les banques qui ont partagé le même index que le contrôle interne d’Illumina ont automatiquement un taux d’alignement plus faible, de l’ordre de 83 %). Afin de valider l’alignement de ces séquences sur les génomes de référence du bovin et du trypanosome, nous avons d’abord vérifié le pourcentage de reads alignés de façon unique sur le génome bovin ou sur le génome du trypanosome. Les résultats du séquençage sont présentés dans la Figure 25.

Figure 25 : Résumé des résultats de séquençage

L’axe des abscisses représente chaque échantillon (120 banques). L’axe des ordonnées le nombre de reads par échantillon. En bleu : les séquences alignées de manière unique sur l’un des génomes de référence (bovin ou trypanosome) (Uniq_map). En noir : les séquences qui ne s’alignent pas (Unmapped). En rose : les séquences qui s’alignent à plusieurs endroits sur le génome du bovin ou sur le génome du trypanosome (MultiMap). En vert : les séquences qui s’alignent à la fois sur le génome du bovin et du trypanosome (MM_BosTcongo).

On remarque qu’une grande majorité des séquences s’alignent de manière unique sur un seul génome de référence (86 % en moyenne). Un nombre important des reads était uniquement aligné sur le génome bovin (85 % en moyenne, de 73 à 88 %). Le pourcentage de reads alignés uniquement sur le génome du trypanosome a varié considérablement d’un échantillon à l’autre, allant de 4*10-6 à 2,72 %, avec une moyenne de 0,24 %. Cette variation observée montre la montée en puissance des trypanosomes au cours de l’infection, depuis les banques réalisées avant, en début et pendant la cinétique d’infection. La Figure 27 illustre ces résultats.

Bien que la majeure partie des reads s’alignent de manière unique, il existe néanmoins une proportion importante de reads qui s’alignent à plusieurs endroits sur l’un ou l’autre des génomes de référence ou même sur les deux (12 % en moyenne). On parle alors de multi alignement. Concernant les séquences qui se sont alignées à la fois sur le génome du bovin et sur le génome du trypanosome (voir Figure 26), il ne nous a pas été possible d’assigner l’organisme de référence.

Figure 26 : Séquences alignées sur les génomes du bovin ET du trypanosome

L’axe des abscisses représente le nombre d’échantillons. L’axe des ordonnées le nombre de reads par échantillon.

Toutefois, la Figure 26 montre qu’on retrouve, par échantillon, au maximum 124 séquences qui sont alignées sur les 2 génomes à la fois. Ce nombre est donc négligeable en comparaison des millions de séquences obtenues par échantillon (28 à 70 millions suivant les banques). Nous montrons donc que la stratégie de mapping simultanée sur les génomes du bovin et du trypanosome permet bien de distinguer l’organisme d’origine des reads. Les reads à alignement multiple retrouvés dans nos résultats d’analyse sont essentiellement des reads qui s’alignent à plusieurs endroits sur le génome du bovin.

Figure 27 : Pourcentage de séquences associées au génome du trypanosome en fonction du temps et de la parasitémie

Les 4 panneaux verticaux représentent les 4 temps sélectionnés pour l’analyse RNA-seq (DPI : Day post infection), de gauche à droite DPI.0, DPI.20, DPI.30 et DPI.40 respectivement. L’axe des abscisses représente le log10 de la parasitémie (+1). L’axe des ordonnées représente le log10 du nombre de séquences attribuées au trypanosome sur le nombre total de séquences attribuées (bovin + trypanosome). En vert : échantillons de bovins de race Baoulé, en violet : Borgou, en rouge : Lagunaire, en bleu : N’Dama et en noir : Zébu.

En effet, avant l’infection (DPI.0), un nombre négligeable de reads s’est aligné sur le génome de Trypanosoma congolense : cela a correspondu à un ratio maximum de 3,8 * 10-5 reads (reads attribués de manière unique au génome du trypanosome/nombre de reads total), soit à 1589 reads maximum. Ce nombre négligeable de reads alignés sur le génome du parasite avant infection peut être assimilé à du bruit de fond, ce dernier étant très probablement issu de la technologie de séquençage et de l’algorithme intrinsèque au logiciel d’alignement utilisé. Au cours de l’infection (DPI.20, 30, 40), le nombre de reads attribués au génome du trypanosome a augmenté et a été étroitement lié à la dynamique d’infection (i.e. à la parasitémie).

Il est apparu, en outre, que certains individus n’ont pas présenté de parasitémie détectable (abscisse = 0) lors de l’infection (à DPI.20 et DPI.40). Cependant, nous avons observé, à ces dates-là, qu’un grand nombre de séquences (taux de l’ordre de 10-4 à 10-3) étaient alignées sur le génome du trypanosome (exemple N8 à DPI.20). Nous avons donc été capables, grâce à la technique RNAseq utilisée, de détecter la présence du parasite chez les animaux infectés alors que cela n’avait pas été le cas lors du comptage des trypanosomes au microscope.

D’autre part, nous nous sommes aperçus que deux individus (BOR_5 et ZFU_4) ont eu des résultats tout à fait étonnants. Dans un premier temps, en effet, ils n’ont manifesté qu’une parasitémie transitoire et n’ont pas été anémiés (Berthier et al., 2015). Ensuite, selon les données RNAseq, à DPI.30 et DPI.40, le nombre de séquences attribuées au génome du trypanosome n’est pas apparu significatif chez ces 2 individus. Il semblerait donc, que chez ces animaux, l’infection ne se soit pas maintenue pour des raisons inconnues. Cet ensemble d’observations nous a amenés à ne pas intégrer ces deux individus (BOR_5 et ZFU_4) dans les analyses ultérieures. Un troisième animal a également été écarté. Il s’agit d’un Baoulé (BAO_3) qui était négatif au moment de l’achat mais qui s’était révélé positif en parasitémie à son arrivée au CIRDES, alors que tous les autres animaux avaient été détectés négatifs lors des tests de diagnostic (Berthier et al., 2015).

Initialement, nous avions donc 120 banques correspondant à 30 animaux mais suite à l’exploration des données, les analyses ont porté sur les 108 banques d’RNA-seq, correspondant à 27 animaux (5 BAO, 5 BOR, 6 LAG, 6 NDA et 5 ZFU) et quatre dates par animal (DPI.0, 20, 30 et 40).