• Aucun résultat trouvé

PARTIE A. DIVERSITÉ SPÉCIFIQUE, SYSTÉMATIQUE ET RÉVISION TAXONOMIQUE DES UDOTEACEAE ET DES RHIPILIACEAE

A. II.2. Supplément Matériels et méthodes

Au total 571 échantillons de Rhipiliaceae ont été traités durant cette étude, parmi lesquels 516 ont pu être séquencés avec les marqueurs tufA, rbcL et 18S rDNA. La liste des échantillons et des séquences associées et les séquences Genbank utilisées sont présentées en annexes 2 et 4. La délimitation d’espèce a été réalisée sur les deux marqueurs chloroplastiques tandis que les reconstructions phylogénétiques finales ont été réalisées à partir d’une matrice concaténée des trois marqueurs.

164

2.a. Constructions phylogénétiques

Pour les analyses de délimitation d’espèces, des reconstructions phylogénétiques en maximum de vraisemblance et en inférence bayésienne (pour les arbres ultramétriques) ont été réalisées pour chacun des marqueurs en ne conservant que les haplotypes distincts.

Les jeux de données ont été analysés avec Partition Finder v1.1.0 afin de déterminer les modèles d’évolution les plus adaptés selon le critère AIC, à la fois pour le jeu de données total (les analyses ML) ou encore subdivisés en position de codons.

Les arbres en ML ont été réalisés sous RAXML (Stamatakis, 2014) depuis le serveur CIPRES (Miller et al., 2010). Les jeux de données ont été partitionnés en position de codons, soient trois partitions pour le jeu de données tufA et six pour rbcL (3x2 fragments). Les analyses pour les deux marqueurs ont été réalisées sous le modèle GTR+I+G, avec l’algorithme « rapid bootstrapping and search for best-scoring ML tree », et 1 000 réplicats de bootstrap (Stamatakis et al., 2008).

Les arbres ultramétriques ont été réalisés par inférence bayésienne avec le logiciel BEAST (Drummond et al., 2012). Pour le marqueur tufA, l’analyse a été réalisée sur un jeu de données en trois partitions avec les modèles évolutifs GTR+G, GTR+I+G et GTR+G, sur 30 M de générations, échantillonnées toutes les 1 000. Pour le marqueur rbcL, six partitions ont été analysées sous des modèles évolutifs distincts (rbcL5’: GTR+I+G, K80+G, K80+I+G ; rbcL3’ : K80+I+G, GTR+I+G, K80+I+G) sur 75 M de générations avec un échantillonnage toutes les 5 000 générations. L’hypothèse d’horloge globale ayant été rejetée, les deux analyses ont été effectuées sous une horloge relâchée non corrélée suivant une loi log normale associée à un modèle de « Coalescent constant size », comme recommandé (Monaghan et al., 2019).

Pour l’analyse phylogénétique finale, basée sur la matrice multimarqueurs (tufA, rbcL et 18S), des méthodes de reconstructions en ML et IB ont été employées.

Les analyses préliminaires en délimitation d’espèces et phylogénie ayant mis en évidence la présence de plusieurs lignées distinctes au sein des Rhipiliaceae (cf. Figure 25), les reconstructions phylogénétiques ont porté sur deux sous-ensembles de données : (1) « Rhipiliaceae groupe 1 » + « Rhipiliaceae groupe 2 », et (2) « Rhipiliaceae groupe 3 » + « Rhipiliaceae groupe 4» représentant les lignées Rhipiliopsis externes à la famille et proches phylogénétiquement des Halimedaceae. Pour ce dernier groupe, des séquences d’ Halimedaceae ont été ajoutées pour mieux appréhender les relations phylogénétiques au sein de cet ensemble.

Les outgroups Codium duthieae, Codium platylobium et Bryopsis plumosa ont été utilisés pour les deux analyses. Les jeux de données évalués par Partition Finder v1.1.0 ont tous indiqué un schéma de partitions par marqueur et, pour les chloroplastiques, également par position de codon.

Les analyses ML ont été réalisées avec RAXML via le serveur CIPRES. Dans les deux cas, la méthode GTR+I+G et l’algorithme « rapid bootstrapping and search for best-scoring ML tree » ont été sélectionnés et l’analyse a été lancée avec 1 000 réplicats de bootstrap.

Les reconstructions en inférence bayésienne ont été réalisées sous Mr Bayes v.3.2 (Ronquist et Huelsenbeck, 2003) via le serveur CIPRES. Pour le premier jeu de données, les modèles évolutifs attribués aux dix partitions étaient : GTR+G, GTR+G et GTR+G+I pour tufA ; GTR+G, JC+G et JC+I pour rbcL5’; JC+I+G, JC+I, GTR+G pour rbcL3’ ; et HKY+I+G pour 18S rDNA. L’analyse a été lancée en deux

165 runs, à partir d’un arbre de départ aléatoire, pour 20 M de générations et un échantillonnage toutes les 1 000 générations. Après vérification de la convergence des runs et des valeurs ESS, les deux premiers millions de générations ont été exclus en tant que burn-in, avant d’estimer l’arbre consensus et les probabilités a posteriori.

Pour le second jeu de données, les modèles évolutifs associés aux sept partitions étaient : tufA : GTR+I+G+, GTR+G et GTR+G ; rbcL : JC+I, GTR+I+G et GTR+G et pour 18S rDNA: GTR+I+G. Les deux runs ont été lancés pour 50M de générations à partir d’un arbre de départ aléatoire et avec un échantillonnage toutes les 5 000 générations. La convergence des runs et les valeurs ESS ont été vérifiées avant d’extraire les cinq premiers millions de générations en tant que burn-in et d’estimer l’arbre consensus et les probabilités postérieures (PP) associées.

2.b. Application des méthodes de délimitations d’espèce

a méthode ABGD a été appliquée directement sur les alignements de chaque marqueur. Le marqueur tufA a été analysé sous la méthode simple distance, avec le paramètre X fixé à 0,8. Pour rbcL, deux jeux de données ont été analysés, à savoir le fragment rbcL5’ et le fragment rbcL3’ compte tenu du déséquilibre dans le rendement des amplifications des deux marqueurs et de la sensibilité de la méthode aux données manquantes. Les méthodes Kimura et Simple distance ont été respectivement appliquées sur les jeux de données rbcL5’ et rbcL3’, avec le paramètre X fixé à 0,8 dans chacun des cas.

L’analyse avec la méthode GMYC a été effectuée sur R via le package « splits » sur les MCCTs de chaque marqueur obtenus par les analyses bayésiennes sous BEAST.

La méthode bGMYC a été appliquée sur un sous-échantillonnage de 100 arbres issus de cette même analyse. Après des tests exploratoires, le jeu de données tufA a été analysés sous 30M de générations, échantillonnées toutes les 100 générations et un burn-in des 10 000 premières générations. Le marqueur rbcL a été analysé sur 20 M de générations, dont les cinq premiers millions exclus en burn-in, et échantillonnés toutes les 100 générations.

La méthode hPTP a été conduite sur le serveur en ligne ((

http://sco.h-its.org/exelixis/web/software/PTP/index.html) sur les arbres ML, sous 500 000 générations échantillonnées toutes les 100 générations pour les deux marqueurs. L’analyse mPTP a été réalisée à la fois sur les arbres en ML et MCCTs pour les deux marqueurs et via le site (http://mPTP.hits.org) avec les paramètres par défaut.

2.c. Morphologie

L’identification des espèces ainsi que le ciblage des caractères morphologiques d’intérêt ont été basés sur : la monographie de Gepp & Gepp (1911) comprenant certaines espèces de Rhipilia et une espèce de Rhipiliopsis ; la monographie de référence de Millar et Kraft (2001) pour le genre Rhipilia ainsi qu’entre autres, les travaux de N’Yeurt et Keats (1997) et Verbruggen et Schils (2012) ; et principalement les travaux de Kraft (1986 et 2000), Farghaly et Denizot (1979), Eisement et Earle (1983), Norris et Blair (1991) et Coppejans et al. (1999) pour le genre Rhipiliopsis.

166