• Aucun résultat trouvé

Le COI ainsi que les autres gènes n’ayant pas apporté des réponses suffisamment claires, j’ai souhaité voir s’il existait dans le génome des Lygus des marqueurs moléculaires plus pertinents pour répondre à la question de caractérisation des espèces. J’ai ainsi utilisé la méthode RADseq (Restriction‐site Associated DNA sequencing) qui est un séquençage NGS (Nouvelle Génération de Séquençage) du génome entier pour la détection, sans a priori, de variations de type SNPs (Single

Nucleotide Polymorphism) et indels (insertions –

délétions) de l’ADN. Cette méthode consiste en un séquençage ciblé des régions adjacentes à des sites de restriction communs répartis sur tout le génome. L’utilisation d’un génome de référence n’est pas nécessaire.

Un « run » RADseq a été réalisé sur 32 échantillons sélectionnés après avoir passé toutes les étapes d’analyses morphologiques, moléculaires et morphométriques. Il m’était difficile de faire cette étude sur l’ensemble des échantillons traités. En effet, pour cette étude, il faut une grande quantité d’ADN de départ ainsi qu’une très bonne qualité et suite à l’ensemble des études effectuées sur les différents gènes, la quantité d’ADN était pour certains échantillons trop faible et donc impossible à intégrer dans cette analyse. Il m’a d’ailleurs fallu extraire d’autres échantillons de L. gemellatus pour cette étude.

Figure 44 : Schéma des étapes de la préparation de la librairie RADSeq.

98

La méthode RADseq (Figure 44) commence par un dosage des extractions d’ADN, et une normalisation de manière à obtenir la même quantité pour chaque échantillon. Puis, les ADN sont digérés avec l’enzyme PstI (5'CTGCA-G 3'). Une fois la digestion terminée, un adaptateur (P1) est ligué. Les adaptateurs utilisés sont listés dans le tableau 2 en annexe 8. Chaque individu aura donc son tag unique et sera ainsi reconnu grâce à

celui-ci.

Une fois la ligation terminée, une sonication est effectuée. La sonication consiste à appliquer une énergie sonore pour agiter les particules d'un échantillon, ce qui permet de couper les ADN aléatoirement. Après cette étape de coupure aléatoire, une sélection des fragments entre 300 et 600 pb est faite à partir d’une migration sur gel « low melting ». Une purification est effectuée et la réparation en 3’ et l’ajout d’une adénine en 3’ permettent ensuite la ligation de l’adaptateur P2. Un enrichissement par amplification des fragments obtenus permet ensuite d’augmenter la quantité de fragments à séquencer. Une fois enrichie, la librairie est quantifiée à l’aide du Qubit Fluorometer (ThermoFisher Scientific) et d’une puce de Bioanalyseur Agilent 2100 (Agilent) et donnée à séquencer à la plateforme MGX de Montpellier sur un appareil NOVASeq 6000. Les étapes de la préparation d’une librairie RADseq sont résumées sur la figure 44.

Une fois le séquençage terminé, les données brutes sont stockées sur le serveur d’INRAe Genotoul et analysées à l’aide du pipeline RADIS (Cruaud et al, 2016) qui repose sur Stacks (Catchen et al, 2011, 2013) pour les grandes étapes de l’analyse : le démultiplexage des données, l’élimination des dupliquas

Figure 45 : Schéma d’un démultiplexage issu du tutoriel de Stacks.

Figure 46 : Schéma de construction de liste de loci disponibles et des liens qui existent entre ces loci (extrait du tutoriel de Stacks).

99

d’amplification et la construction de loci individuels ou d’un catalogue de loci pour chaque échantillon analysé (Figure 45 et 46).

La première étape de cette analyse de séquences consiste à sauvegarder les données brutes et à vérifier si lors du téléchargement de ces données, l’intégrité des données a été conservée. Une fois que ces données sont accessibles, une étape de filtrage des données est effectuée. Les séquences de mauvaise qualité sont éliminées ainsi que celles qui ne contiennent pas le site de restriction. La recherche du nombre de PCR dupliquées (issues de la PCR d’enrichissement) est effectuée et les séquences en découlant sont également éliminées et mises dans un fichier « clone_filter ». Ensuite, une recherche des adaptateurs P1 et P2 est faite ce qui permet d’attribuer directement les séquences à l’échantillon étudié, les fichiers de séquences sont donc renommés avec le numéro ID de l’individu (= démultiplexage) (Figure 45) et on obtient ensuite le nombre de lectures prêtes (Read1 [équivalent de forward] et Read2 [équivalent de Reverse]) pour les analyses de données. Une fois que ces données sont prêtes, on construit un nombre de loci pour chaque individu ainsi qu’une liste (catalogue) d’allèles disponibles pour faire des analyses de génétique de populations ou phylogénétique (Figure 46).

Chaque paramètre du pipeline utilisant Stacks est fixé par l’utilisateur : i) j’ai fixé à 2 (le minimum) le nombre maximum de nucléotides de différence entre les groupes (M : groupe constitué par l’assemblage des lectures qui matchent exactement ou avec peu de différences) ; ii) j’ai fixé à 10 le nombre de différences entre les loci individuels (n) ; enfin j’ai fixé à 100, le nombre de loci pour un échantillon à garder dans l’analyse (L). Ainsi, après plusieurs essais, j’ai appliqué les paramètres suivants appelés stacks_M2n10S8L100, M=2 (ustacks), n=10 (cstacks), L=100. S=8 correspond au nombre d’échantillons pour lesquels les loci sont en commun. Seuls les échantillons qui ont 100 loci pour lesquels au moins 8 individus ont les séquences sélectionnées (S=8). Une fois ces paramètres déterminés, une analyse avec RAxML est effectuée pour obtenir un arbre phylogénétique en utilisant les paramètres suivant : GTRGAMMA et 100 réplications de Bootstrap. L’arbre reconstruit est visualisé à l’aide de Treegraph.

4- Essai d’identification morphométrique

Le principe est de mettre en évidence des différences de taille et de conformation dans le but d’identifier et de quantifier les différences morphologiques entre les taxons. Les fondements de chacune des analyses morphométriques (par points homologues et par contour) ont été abordés dans le chapitre 3 « Matériels et Méthodes Généraux ».

Chaque mâle du genre Lygus (ceux pour lesquels l’ADN a été extrait et séquencé) est photographié dorsalement quand cela a été possible. J’ai essayé d’avoir le maximum d’échantillons dans la mesure du possible (tableau 10).

100

Le nombre indiqué pour la dissection correspond au nombre de spicules corrects. Tous les spécimens ont été disséqués mais en fonction de la dissection du spicule et du stade des adultes (mue imaginale récente), le nombre de spicules pouvant servir aux études s’est trouvé réduit. Sur chaque photo, une analyse utilisant des points homologues, ainsi qu’une analyse de morphométrie géométrique basée sur le contour du pronotum et sur celui du pronotum couplé avec les hémélytres a été pratiquée quand cela a été possible en fonction des éventuels dommages énumérés précédemment subis par l’échantillon. Le nombre de photos représente donc le nombre d’échantillons a priori corrects pour chaque espèce.