Comment estimer les modèles démographiques par l'approche ABC ?
Stéphane De Mita IRD
UMR DIADE - Equipe Dynadiv demita@gmail.com
Atelier domestication - 13 avril 2011 Page 2 de 29
Objectifs
● Tester des scénarios démographiques
● Estimer les paramètres des modèles
● Constituer une hypothèse nulle démographiquement réaliste
Nordborg et al. 2005 PLoS Biol. 3(7): e196.
Arabidopsis thaliana
Atelier domestication - 13 avril 2011 Page 3 de 29
Approche de Wright et al. 2005
Wright et al. 2005 Science 308:1310-1314
fixé mesuré
ajusté par simulation-rejet ajusté par vraisemblance
2450 individus Np
T
Na μ c
d c
Nb
0 2000 4000 6000 8000
Vraisemblance:
proportion de simulations acceptées pour un Nb donné
Atelier domestication - 13 avril 2011 Page 4 de 29
ABC: Approximate Bayesian Computation
Paramètres de la population
vrais - inconnus Statistiques de l'échantillons mesurés
θ
0S
θ
bπ
T1
T2
θ0 θb
?
Beaumont et al. 2002 Genetics 162:2025-2035
Page 5 de 29
P ( M∣D )= P ( D ∣M )⋅ P ( M ) P ( D )
Modèle: valeurs de paramètres Données: statistiques observées
Posterior
distribution des valeurs de paramètres (variable d'intérêt)
Prior
distribution a priori des paramètres Vraisemblance des données
Constante de normalisation
ABC: théorème de Bayes
Page 6 de 29
ABC: procédure
θ
0θ
bPrior donné
S π
Statistiques observées
Page 7 de 29
ABC: Approximate Bayesian Computation
θ
0θ
bEchantillonnage aléatoire dans prior donné
S
π
Page 8 de 29
ABC: Approximate Bayesian Computation
θ
0θ
bGénération (par simulation) des statistiques correspondantes
S
π
Page 9 de 29
ABC: Approximate Bayesian Computation
θ
0θ
bS π
θ
0θ
bSélection et pondération des valeurs de statistiques les plus proches
S
π
Page 10 de 29
ABC: Approximate Bayesian Computation
θ
0θ
bS π
θ
0θ
bSélection et pondération des valeurs de statistiques les plus proches
S
π
Page 11 de 29
ABC: Approximate Bayesian Computation
θ
0θ
bS π
θ
0θ
bCorrection des paramètres en fonction de la relation paramètres ~ statistiques
S
π
Page 12 de 29
ABC: Approximate Bayesian Computation
statistique paramètre
Page 13 de 29
ABC: Approximate Bayesian Computation
statistique paramètre
statistique observée
Page 14 de 29
ABC: Approximate Bayesian Computation
statistique paramètre
statistique observée
Page 15 de 29
ABC: Approximate Bayesian Computation
statistique paramètre
statistique observée
Page 16 de 29
ABC: Approximate Bayesian Computation
θ
0θ
bDistribution “postérieure” finale
Page 17 de 29
Example : histoire démographique de Medicago truncatula
K = 2
●
Plante autogame (s = 96%)
●
Milieux ouverts, perturbés
●
Populations très différenciées (forte dérive)
●
Répartition : bassin méditerranéen
Structure à grande échelle
(n=346, 13 locus microsatellites)
Proportion de variance expliquée proche de 10%
Page 18 de 29
Distribution des statistiques de diversité
●
30 locus (supposés) neutres
36 échantillons Ouest 33 échantillons Est
Biais des statistiques par rapport à des simulations neutres (sans structure, taille de populations stable)
observé simulations
Page 19 de 29
Modèles ABC
M
θ θ θ α
θ α
M
θ α 1 α 2 M
SNM
np=1IM
np=2PEM
np=2IMG
np=3IMiG
np=4Page 20 de 29
Statistiques résumantes
Niveau de polymorphisme dans les deux populations
Spectre de fréquence conjoint (allèles minoritaires, par classe)
Total: 2 + 36 = 38 statistiques résumantes
Page 21 de 29
Phase d'échantillonnage
IM: 100 000 points échantillonnés
Distribution des statistiques simulées
valeur observée
Page 22 de 29
Phase d'ajustement - SNM
1% (1000) points acceptésPage 23 de 29
Phase d'ajustement - IM
1% (1000) points acceptésPage 24 de 29
Phase d'ajustement - PEM
1% (1000) points acceptésPage 25 de 29
Phase d'ajustement - IMG
1% (1000) points acceptésPage 26 de 29
Phase d'ajustement - IMiG
1% (1000) points acceptésPage 27 de 29
Comparaison de modèles
● Mélange de plusieurs modèles alternatifs
● Phase de rejet uniquement (tolerance fixée)
● Proportion des différents modèles parmi les points acceptés
sur 5X
100 000 points
Page 28 de 29
Comparaison de modèles - test a posteriori
● Tirage d'un gène au hasard parmi les 30 (valeur observée)
● Retirage de 1000 valeurs de paramètres (distribution nulle)
● Test à 5% bilatéral
Page 29 de 29