• Aucun résultat trouvé

FOCUS SUR LES PROCESSUS D’INTRODUCTIONS EN EUROPE

D. Processus d’introduction à l’échelle européenne

1. Matériel et méthode

1.3 Analyses statistiques

1.3.1 Indices de diversité génétique et de structure intrapopulation

L’absence de déséquilibre de liaison entre les locus a été testée grâce au logiciel Genepop V3.4 (Raymond & Rousset 1995).

Pour chaque population et chaque groupe de populations, le polymorphisme nucléaire a été évalué en calculant les fréquences alléliques pour chacun des 10 locus, la richesse allélique (Ar; El Mousadik & Petit 1996), l’hétérozygosie attendue (He) et observée (Ho) avec les logiciels Genepop V3.4 (Raymond & Rousset 1995) et Fstat v.2.9.3.2 (Goudet 1995, 2002). La richesse allélique est préférée ici au nombre moyen d’allèles par locus. Cet indice de raréfaction permet en effet une standardisation du nombre moyen d’allèles par locus sur le plus petit effectif d’individus échantillonné dans les populations (El Mousadik & Petit 1996).

Chapitre 2 : Europe, introductions primaires et secondaires Il est particulièrement conseillé lorsque toutes les populations d’une étude ne sont pas composées du même nombre d’individus, ce qui est notre cas. Un test de comparaison des niveaux moyens de diversité dans chaque zone a également été réalisé avec le logiciel Fstat v.2.9.3.2.

Le déficit en hétérozygotes, par rapport aux attendus génotypiques sous l’hypothèse d’équilibre d’Hardy-Weinberg, au sein des populations a été quantifié par l’estimateur ƒ de l’indice de fixation FIS (Weir & Cockerham 1984). La significativité des écarts aux proportions attendues sous l’équilibre de Hardy-Weinberg a été testée par un test G avec le logiciel Fstat v.2.9.3.2. (Goudet 1995, 2002). Avec des marqueurs non soumis à la sélection, le déficit en hétérozygotes peut avoir 3 causes potentielles : (i) une reproduction entre individus apparentés, dont la forme extrême est l’autofécondation, ou une reproduction par parthénogenèse, dans ce cas une majorité voire l’ensemble (dans le cas de parthénogénèse ou d’autofécondation obligatoire répétée) des locus sont affectés par le déficit en hétérozygotes, (ii) des allèles nuls ; c’est ici un problème technique qui ne permet pas l’amplification de certains allèles augmentant alors la proportion d’individus considérés homozygotes et (iii) l’existence de groupes génétiquement différents au sein de la population échantillonnée et ne participant pas au même événement de reproduction ; même si les groupes sont à l’équilibre de Hardy-Weinberg, l’hétérozygotie globale est inférieure à l’hétérozygotie attendue à l’échelle de la population à l’équilibre de Hardy-Weinberg (effet Wahlund). Dans ce cas le déficit en hétérozygote n’est visible qu’à un nombre limité de locus.

Pour estimer si les déficits en hétérozygotes pouvaient être associés à des événements d’autofécondation ou à des artéfacts techniques (i.e. allèles nuls), le taux d’autofécondation s(g2) dans chacune des populations a été estimé en utilisant la méthode proposée par David et al. 2007) et paramétrée dans le logiciel RMES. L’algorithme de ce programme prend en compte le déficit en hétérozygotes comme dans la formule classique FIS=S/(2-S) (Hartl & Clark 1997) mais également la corrélation multilocus dans chacune des populations (David et al. 2007).

Nei et al. (1975) ont montré qu’au cours d’un effet fondateur, la diversité allélique diminue plus vite que l’hétérozygotie. Ainsi, dans une population ayant récemment subi un goulot d’étranglement, la diversité génétique attendue à partir des fréquences observées (mesurée par He) est supérieure à celle attendue à l’équilibre mutation-dérive pour le nombre d’allèles observé dans la population (Luikart et al. 1998). Inversement, les populations en phase d’expansion sont caractérisées par des déficits en hétérozygotes par rapport aux 62

attendus (Maruyama & Fuerst 1984). Les traces de variations récentes de taille efficace (Ne) ont donc été recherchées par cette méthode, en utilisant le logiciel Bottleneck (Cornuet & Luikart 1996). Le modèle mutationnel choisi, qui permet d’établir la relation de référence à l’équilibre mutation-dérive, est le modèle en deux phases (« TPM» ; Maruyama & Fuerst 1985), recommandé par les auteurs pour les analyses de microsatellites. Pour tester, si un déficit ou un excès d’hétérozygotie significatif existe, trois méthodes sont proposées. Seul le test de rang de Wilcoxon (Luikart & Cornuet 1997) sera utilisé ici, car il est assez puissant pour être utilisé à partir de dix locus polymorphes.

1.3.2 Structure génétique entre les populations

La structure génétique calculée sur l’ensemble des populations ainsi qu’entre paires de populations a été évaluée en calculant l’estimateur θ de l’indice FST (Weir & Cockerham 1984) grâce au logiciel Fstat v.2.9.3.2 (Goudet 1995, 2002). La significativité de chaque comparaison a été calculée dans Fstat v.2.9.3.2. L’hypothèse nulle testée ici est l’absence de différenciation génétique entre paire de populations et le seuil de significativité initial (α) fixé à 5%. Sur l’ensemble des populations, 378 tests indépendants ont été réalisés. Le risque de rejeter l’hypothèse nulle alors qu’elle est vraie augmente avec le nombre de tests réalisés. Pour limiter la proportion d’erreur, le seuil de significativité a donc été ajusté selon le critère de Bonferroni (π = α/nombre de test), tel que suggéré dans le logiciel Fstat v.2.9.3.2. Les différences génétiques obtenues entre populations ont été visualisées grâce à une analyse en composante principale basée sur les fréquences alléliques, en utilisant le logiciel PCA-GEN v.1.2.1 (Goudet 1999).

Une analyse hiérarchique de la variance moléculaire (AMOVA) a également été conduite avec les données nucléaires, avec le logiciel Arlequin v3.01 (Schneider et al. 1992), afin d’étudier la variation génétique entre les populations sur l’ensemble de l’étude (θST), entre les populations au sein des groupes (θSC) et entre les groupes (θCT). Les populations ont été regroupées en 4 groupes, en fonction de leur position géographique et de leur histoire d’introduction :

(i) les Pays Bas, dont l’histoire d’introduction récente serait en relation avec les activités conchylicoles,

(ii) la Manche Orientale, dont la présence a été mise en relation avec les activités nautiques et les transports maritimes

Chapitre 2 : Europe, introductions primaires et secondaires (iii) la Bretagne et la façade Atlantique de la France, dont l’histoire est très

étroitement liée à la culture d’U. pinnatifida

(iv) l’Espagne, dont l’éloignement géographique avec les autres populations spontanées européennes limite la possibilité d’échanges naturels de migrants. La population de Thau et la culture bretonne ont volontairement été isolées des autres populations. Dans cette étude, elles serviront principalement de point de référence.

Ce regroupement de populations est basé sur des critères subjectifs et peut ne pas rendre compte de la structure réelle des populations du jeu de données. Pour s’affranchir de ce type de classification a priori des populations, nous avons effectué un autre type d’analyse, utilisant une technique Bayésienne de regroupement des populations. Sous l’hypothèse de l’indépendance des locus, cette technique permet d’estimer combien d’unités panmictiques (i.e. à l’équilibre de Hardy Weinberg) composent notre jeu de données et de calculer la probabilité d’assignation a posteriori de chaque individu aux différentes unités (Pritchard et al. 2000 , Manel et al. 2005). Dans le logiciel Structure (Pritchard et al. 2000) utilisé ici, l’utilisateur fixe au début de chacune des simulations le nombre d’unités panmictiques (K) qui composent le jeu de données. En fonction des paramètres du modèle ancestral et du modèle d’évolution des fréquences alléliques choisis par l’utilisateur d’une part, et des données réelles d’autre part, les probabilités d’assignation a posteriori des individus à chacune des unités sont calculées. Dans cette analyse, la probabilité d’assignation d’un individu à une unité est réalisée conjointement pour l’ensemble des unités (Manel et al. 2002). Le nombre d’unités panmictiques présentes dans le jeu de données est associé à la simulation pour laquelle K présente la plus grande vraisemblance et une variance entre les simulations faible, compte tenu des données réelles et du modèle sélectionné. Les auteurs de Structure notent toutefois, que le choix dans la valeur de K doit également avoir une signification biologique et peut être laissée à l’appréciation de l’utilisateur (voir aussi Evanno et al. 2005).

La répartition d’U. pinnatifida a certainement été influencée par les activités anthropiques, avec le transport accidentel ou volontaire d’individus entre régions. Le modèle ancestral « avec admixture » choisi ici, permet de prendre en compte ces mélanges (Pritchard et al. 2000). Dans la mesure où les échanges entre les différentes populations peuvent avoir lieu ou que plusieurs populations peuvent partager des populations ancestrales communes, le modèle de fréquences alléliques inférées dans chaque population est celui des « fréquences corrélées ». Les valeurs de K testées vont de K=1 (ce qui correspondrait à une absence totale 64

de structure au sein de la région européenne) à K=27 (ce qui indiquerait une structure maximale de la région européenne). Les paramètres de simulation sont les suivants : burn-in 50 000 et 150 000 répétitions pour la chaîne de Markov.

1.3.3 Distance géographique et génétique des populations

L’hypothèse d’un isolement génétique par la distance a été testée pour les données nucléaires pour chacune des zones géographiques analysées. Pour cela un test de Mantel a été réalisé avec le logiciel Genepop V3.4. afin de tester l’hypothèse d’une corrélation positive entre les matrices de distances géographiques et génétiques. L’estimateur de différence génétique utilisé ici est l’estimateur θST de l’indice FST qui sert à déterminer la distance génétique θST/(1- θST) (Rousset 1997). La distance géographique entre deux populations a été mesurée en suivant les principales courbes du trait de côte (annexe 6).

2. Résultats