• Aucun résultat trouvé

Chapitre 1 : Simulations génétiques et détection statistique de la sélection épistatique entre

1.5 Résultats des simulations

1.5.1 Contrôle qualité des simulations

Les simulations ont été réalisées afin de comprendre les mécanismes évolutifs liés à la sélection épistatique et tester les outils statistiques permettant sa détection.

Afin de vérifier que le polymorphisme génétique de la population ancestrale de départ (avant la séparation en deux populations) reflète bien celui d’une population de taille constante évoluant sous un modèle neutre, nous avons calculé son spectre de fréquences alléliques (SFS). La Figure 16 présente un spectre de fréquences (SFS) calculé à la génération 0 sur un chromosome simulé par coalescence. Le SFS mesure la distribution du nombre de sites polymorphes (SNP) selon les classes de fréquences des mutations (allèle dérivé) chez les 500 individus diploïdes simulés. Ce spectre a une forme en « L » indiquant une forte proportion de SNP ayant des mutations en faibles fréquences et un nombre décroissant de SNP avec des mutations en fréquences croissantes dans la population, typique de ce qui est attendu dans un modèle neutre d’évolution (Figure 12). Les chromosomes générés par coalescence ont été correctement simulés et peuvent servir de point de départ pour les simulations « forward in time ».

81

Afin de vérifier que les simulations « forward in time » ont été correctement réalisées, nous avons calculé les statistiques 𝐹𝑆𝑇(𝐹𝑆𝑇 = 𝑣𝑎𝑟(𝑝𝑡)

𝑝0(1−𝑝0))et 𝐹𝐼𝑆(𝐹𝐼𝑆= 𝐻𝑒− 𝐻𝑜

𝐻𝑒 = 1 − 𝐻𝑜

𝐻𝑒)pour estimer le degré de structuration génétique des populations et l’apparentement au sein des populations, au cours des générations. À l’issue des simulations (génération 300), les 𝐹𝐼𝑆 moyens obtenus dans les populations simulées en autogamie et panmixie étaient respectivement de 0.92 et 0.07, tandis que les 𝐹𝑆𝑇 moyens étaient de 0.19 et 0.10 (Figure 17). Ces résultats sont cohérents avec les paramètres des simulations que nous avons fixés, les populations autogames à 95% présentant un taux de consanguinité élevé montrant un déficit global en hétérozygotie et les valeurs moyennes de 𝐹𝑆𝑇 montrent une différenciation des populations modérée à forte selon les régimes de reproduction (Wright, 1978).

82

Enfin, nous avons suivi l’évolution des fréquences alléliques des SNP cosélectionnés. Des exemples d’évolution des fréquences alléliques sont montrés en Figure 18 ; nous suivons l’évolution des fréquences des allèles dérivés a et b dans les populations globales des SNP situés au milieu des deux chromosomes A et B et qui sont la cible de la sélection dans les différents modèles évolutifs. Les fréquences alléliques sont représentées pour trois simulations prises au hasard dans chacun des quatre modèles de sélection et pendant les 300 générations de simulation. Dans le modèle neutre, on observe une évolution aléatoire des fréquences entre les paires d’allèles a et b aux trois simulations. Dans le modèle de sélection épistatique coadapté, il y a une cofixation rapide des allèles a et b aux trois simulations et dans le modèle de sélection additif, on observe une cofixation des allèles mais l’évolution des fréquences semble moins corrélée entre a et b. Enfin, dans le modèle compensatoire, on observe une coévolution des fréquences entre les paires d’allèles a et b dans les trois simulations avec un maintien du polymorphisme. Cette figure montrant l’évolution des fréquences alléliques ne représente pas les différents modèles de reproduction ni les différentes formes d’interaction entre les allèles dérivés et ancestraux (les simulations montrées ici sont réalisées en autogamie avec codominance des allèles), mais elle permet de visualiser le type d’évolution des fréquences des allèles au cours des générations.

83

Afin de rendre compte de l’efficacité de la sélection épistatique simulée, la Figure 19 présente les taux de cofixation des haplotypes ab cosélectionnés (respectivement AB) dans les populations globales. Les taux de cofixation sont calculés sur la base des 1000 simulations réalisées pour les quatre modèles évolutifs (neutre, coadapté, additif et compensatoire) ainsi que pour les deux régimes de reproduction (autogamie et panmixie) et les trois modes d’interactions entre les allèles (récessif, codominant et dominant). La Figure 19 montre que les modèles coadapté et additif ont des taux de cofixation plus élevés que le modèle compensatoire car ce sont deux modèles de sélection positive. Dans le modèle compensatoire, il y a un maintien du polymorphisme car la sélection se fait sur les haplotypes

84

générations, bien que dans certaines simulations l’un des deux haplotypes ab ou AB peut se fixer dans l’une ou l’autre (ou les deux) sous-populations.

D’autre part, la fixation est plus rapide dans le modèle coadapté par rapport au modèle additif notamment en autogamie où la récessivité, la codominance et la dominance des mutations n’a pas d’effet car il y a très peu d’individus hétérozygotes (𝐹𝐼𝑆 = 0.92). En autogamie, le taux de cofixation des allèles dérivés atteint plus rapidement un plateau par rapport à la panmixie. En panmixie, le mode d’interaction entre les allèles d’un même locus (récessif, codominant et dominant) influence fortement la dynamique de cofixation car les allèles sélectionnés sont présents dans plusieurs génotypes sélectionnés notamment chez les individus hétérozygotes (𝐹𝐼𝑆 = 0.07) (Tableau 2). Si les mutations sont codominantes, le taux de cofixation est plus élevé en panmixie qu’en autogamie mais si les mutations sont dominantes le taux de cofixation est plus faible en panmixie. En effet, en cas de dominance, les individus

85

hétérozygotes qui portent l’allèle ancestral ont le même coefficient de sélection que les individus homozygotes pour l’allèle dérivé et cela favorise le maintien des deux allèles dans la population (Tableau 2). Enfin, les taux de cofixation des allèles ancestraux A et B sont proches de zéro dans les modèles coadapté et additif (puisque l’on sélectionne a et b) tandis que dans le modèle compensatoire, les allèles ancestraux se maintiennent et le taux de cofixation de l’haplotype AB est même supérieur à celui de ab. Ce résultat peut être expliqué par le fait que les allèles aux deux SNP soumis à la sélection sont en fréquences intermédiaires dès de début des simulations (0.25 < freq(a) ou freq(b) < 0.75) mais cette distribution n’est pas uniforme, et les allèles ancestraux sont toutefois plus fréquents (Annexe 3). En effet, si l’on se place à la génération 0, la médiane de la fréquence de l’allèle a dans la population totale est de 0.43 et à la génération 100 (modèle neutre) elle est de 0.446 en autogamie et 0.435 en panmixie (Annexe 3). Pour résumer, le modèle de sélection épistatique compensatoire présente un faible taux de fixation des allèles dérivés cosélectionnés car il y a maintien du polymorphisme tandis que le modèle de sélection épistatique coadapté et le modèle de sélection additive amènent plus souvent à la fixation des allèles dérivés. De plus, le modèle codominant est le modèle pour lequel nous observons les taux de cofixation les plus élevés notamment en panmixie ; nous détaillerons principalement les résultats obtenus en codominance pour la suite des résultats. Enfin, les valeurs de cofixation que nous avons obtenues doivent être interprétées au regard des populations simulées qui sont de taille relativement faible (N=250 individus par sous-population) et qui ont des régimes de reproduction différents. En effet, l’efficacité de la sélection dépend du produit 𝑁𝑒𝑠 où 𝑠 est le coefficient de sélection et 𝑁𝑒 la taille efficace de la population. Ainsi l’efficacité de la sélection augmente avec la taille de la population d’un facteur 𝑁𝑠 qui dépend de 𝑁𝑒 lui-même étant directement relié au mode de reproduction (Glémin, 2007).

1.5.2 Déséquilibre de liaison entre paires de locus sous sélection