• Aucun résultat trouvé

Les sncRNA comme biomarqueur de la fertilité mâle ?

1) Éléments de contexte

Comme évoqué en introduction, le contrôle qualité de la semence est un enjeu important pour la filière insémination, de façon à garantir une bonne fertilité du taureau et de ses éjaculats, et peut être demain s’assurer de l’absence de désordres épigénétiques pour garantir l’expression du potentiel génétique de la descendance. Différentes approches ont été explorées pour établir un prédicteur de la fertilité, basées principalement sur divers paramètres en lien avec la fonctionnalité ou la physiologie des spermatozoïdes. Mais tous ces paramètres et prédicteurs se sont avérés insuffisants et seule leur combinaison par des approches de régression « stepwise » ou « logistic » a permis d’améliorer la prédiction, qui n’explique toutefois que 40% de la variabilité de la fertilité observée1. D’où l’idée d’explorer

un éventuel lien entre fertilité et expression des sncRNA du spermatozoïde, idée fondée sur les avancées scientifiques, détaillées dans le Chapitre II, montrant un lien entre sncRNA spermatiques et paramètres fonctionnels de la semence (motilité ou anomalie du spermograme237,239,240), fertilité des mâles241,242 ou développement de la

descendance167,223,225.

Dans les chapitres précédents, nous avons réalisé l’inventaire des sncRNA du spermatozoïde bovin, en précisant leur origine tissulaire. L’étape suivante, objet de ce chapitre, consiste à étudier le lien entre l’expression de ces sncRNA et la fertilité des taureaux, afin de mettre en évidence des biomarqueurs utilisables en contrôle qualité de routine, éventuellement combinés aux paramètres fonctionnels ou d’autres biomarqueurs « omics ».

197 2) Plan expérimental

2.1) Constitution de la bio-banque d’éjaculats

Les semences de 154 taureaux Holstein (N=54) et Montbéliard (N=100) ont été fournies par trois centres de production de semence (figure 35) : Évolution XY (Saint Aubin du Cormier, France) pour les éjaculats de taureaux Holstein et Umotest (Roulans, France) et EvaJura (Crançot, France), pour les taureaux Montbéliards. Afin de limiter d’éventuelles variations liées à l’évolution de pratiques d’élevages au cours du temps, l’année de naissance des taureaux de l’étude a été limitée à la période 2011-2015.

Figure 35 : Localisation des centres de production de semence.

154 éjaculats de taureaux Holstein (N=54) et Montbéliard (N=100) ont été utilisés pour la recherche de biomarqueur de la fertilité mâle. Un seul centre (Évolution XY) a fourni la semence de taureaux Holstein. En revanche, pour celle des taureaux Montbéliards deux centres de production situés relativement proche l’un de l’autre, ont été sollicités (Eva Jura et Umotest). ©Allice ©Umotest ©Veeteeltvlees pour EVA Jura

Chaque taureau est représenté par un pool de 2 à 5 éjaculats produits entre 17 et 19 mois d’âge. Les taureaux ont été choisis suivant leur indicateur de fertilité basé sur le TNR56 corrigé (effet taureau X campagne issu de l’indexation fertilité femelle à 56 jours), et regroupés en mâles « supfertiles » si leur indicateur est supérieur à +1 écart-type de la moyenne de la

198 population globale étudiée (centrée réduite) ou en mâles « subfertiles » si leur indicateur est inférieur à -1 écart-type. Chez les taureaux Holstein, 21 sont subfertiles et 33 supfertiles. Chez les taureaux Montbéliards, 43 sont subfertiles et 57 supfertiles.

2.2) Analyse des paramètres fonctionnels de la semence

Les principaux paramètres fonctionnels post-décongélation de la semence ont été analysés : viabilité (% de spermatozoïdes ayant une membrane intacte), développement énergétique (% de spermatozoïdes ayant une mitochondrie active (HMMP) et niveau de production énergétique (MYH)), oxydation cellulaire (% de spermatozoïdes vivants oxydés et niveau d’oxydation) et motilité (% de spermatozoïdes mobiles, progressifs et paramètres liés à la vitesse (µm/s) et au type (µm ou %) de déplacement : VAP, VSL, ALH, LIN…). Le système CASA « IVOS II » (Hamilton Thorne) a été utilisé pour l’analyse de la motilité et le cytomètre en flux « Easycyte 8HT » couplé aux kits « Easykits » (IMV Technologies) pour les autres tests. Les principes et les modes opératoires des différents kits sont décrits dans Sellem et al.,201564.

2.3) Extraction d’ARN total et séquençage des sncRNA.

Le protocole d’extraction d’ARN total, basé sur une extraction au Trizol-chloroforme modifiée et optimisée, est identique à celui utilisé précédemment pour l’établissement des catalogues. Le contrôle qualité a comporté un dosage en fluorimétrie (Qubit® RNA HS Assay Kits, Q32852 Life Technologies) comme réalisé précédemment pour l’établissement des catalogues243.

Le séquençage NGS ILLUMINA a été confié en prestation de service à Qiagen. Les librairies ont été réalisées à partir de 10ng d’ARN extrait, en utilisant le kit QIAseq miRNA Library Kit® et l’indexation UMI (Unique Molecular Indexes). Les UMI représentent un système de code-barre utilisé pour supprimer les biais techniques d’amplifications lors de la création des banques. L’approche est donc identique à celle mise en œuvre pour l’établissement de la dynamique d’expression et l’origine tissulaire des sncRNA. Le séquençage haut débit a été réalisé à l’aide

199 d’un séquenceur Illumina HISeq2000, avec un objectif de 20 millions de séquences (75 paires de bases en single-end) par échantillon.

Le pipeline bio-informatique est également identique à celui utilisé précédemment : les séquences résultantes de biais d’amplification ont été éliminées, tout comme les séquences inférieures à 17 nucléotides ou présentant un score de qualité faible (Phred score<25) ; miRDeep2 a ensuite été utilisé, avec le génome bovin (BosTau9) comme référence, pour quantifier et identifier les miRNA connus (miRBase v22) et prédire de nouveaux miRNA ; les séquences ont été annotées à l'aide de plusieurs bases de données publiques, dont Ensembl release 94 (www.ensembl.org), RFAM release 14 (http://rfam.wustl.edu), les ARN non codants bovins de l'ENA (https://www.ebi.ac.uk/ena), les ARNt bovins de GtRNAdb

(www.gtrnadb.ucsc.edu) et les piARN humains, murins et bovins de l'ENA.

2.4) Les différentes approches statistiques

Un filtre sur le niveau d’expression a été appliqué, afin d’éliminer des analyses toutes les séquences dont la somme des comptages, toutes banques confondues, ne dépassait pas 100 copies. Deux approches statistiques ont été utilisées pour mettre en évidence d’éventuels biomarqueurs : une analyse statistique descriptive multidimensionnelle pour traiter un grand nombre de variable et s’extraire de tout modèle sous-jacent (Between Class Analysis, BCA ; package R ade4 avec la fonction dudi.bca) et une analyse différentielle pour identifier les sncRNA présentant des différences d’expression statistiquement significatives (package R DeSeq2, p-value ajustée (Benjamini-Hochberg) ≤ 5%).

La mise au point d’une équation de prédiction en race Montbéliarde, exploitant un sous- ensemble pertinent de biomarqueurs, a reposé sur une approche « d’ensemble learning » combinant deux algorithmes de « machine learning » (collaboration avec Datastat, IDELE). Pour ce faire, le dispositif de taureaux a été divisé en deux sous-ensembles : un sous-ensemble « d’apprentissage » (70% de la population étudiée) et un sous-ensemble de « test » (30% restant). Afin de réduire le nombre de variables à traiter, la matrice des sncRNA a été réduite aux séquences différentiellement exprimées identifiées par DeSeq2. Les variables les plus informatives ont été sélectionnées par la méthode VSURF (package R vsurf). La prédiction de fertilité est ensuite réalisée par un méta-modèle, qui combine les prédictions obtenues à

Documents relatifs