• Aucun résultat trouvé

Comment estimer les modèles démographiques par l'approche ABC?

N/A
N/A
Protected

Academic year: 2022

Partager "Comment estimer les modèles démographiques par l'approche ABC?"

Copied!
29
0
0

Texte intégral

(1)

Comment estimer les modèles démographiques par l'approche ABC ?

Stéphane De Mita IRD

UMR DIADE - Equipe Dynadiv demita@gmail.com

(2)

Atelier domestication - 13 avril 2011 Page 2 de 29

Objectifs

Tester des scénarios démographiques

Estimer les paramètres des modèles

Constituer une hypothèse nulle démographiquement réaliste

Nordborg et al. 2005 PLoS Biol. 3(7): e196.

Arabidopsis thaliana

(3)

Atelier domestication - 13 avril 2011 Page 3 de 29

Approche de Wright et al. 2005

Wright et al. 2005 Science 308:1310-1314

fixé mesuré

ajusté par simulation-rejet ajusté par vraisemblance

2450 individus Np

T

Na μ c

d c

Nb

0 2000 4000 6000 8000

Vraisemblance:

proportion de simulations acceptées pour un Nb donné

(4)

Atelier domestication - 13 avril 2011 Page 4 de 29

ABC: Approximate Bayesian Computation

Paramètres de la population

vrais - inconnus Statistiques de l'échantillons mesurés

θ

0

S

θ

b

π

T1

T2

θ0 θb

?

Beaumont et al. 2002 Genetics 162:2025-2035

(5)

Page 5 de 29

P ( M∣D )= P ( D ∣M )⋅ P ( M ) P ( D )

Modèle: valeurs de paramètres Données: statistiques observées

Posterior

distribution des valeurs de paramètres (variable d'intérêt)

Prior

distribution a priori des paramètres Vraisemblance des données

Constante de normalisation

ABC: théorème de Bayes

(6)

Page 6 de 29

ABC: procédure

θ

0

θ

b

Prior donné

S π

Statistiques observées

(7)

Page 7 de 29

ABC: Approximate Bayesian Computation

θ

0

θ

b

Echantillonnage aléatoire dans prior donné

S

π

(8)

Page 8 de 29

ABC: Approximate Bayesian Computation

θ

0

θ

b

Génération (par simulation) des statistiques correspondantes

S

π

(9)

Page 9 de 29

ABC: Approximate Bayesian Computation

θ

0

θ

b

S π

θ

0

θ

b

Sélection et pondération des valeurs de statistiques les plus proches

S

π

(10)

Page 10 de 29

ABC: Approximate Bayesian Computation

θ

0

θ

b

S π

θ

0

θ

b

Sélection et pondération des valeurs de statistiques les plus proches

S

π

(11)

Page 11 de 29

ABC: Approximate Bayesian Computation

θ

0

θ

b

S π

θ

0

θ

b

Correction des paramètres en fonction de la relation paramètres ~ statistiques

S

π

(12)

Page 12 de 29

ABC: Approximate Bayesian Computation

statistique paramètre

(13)

Page 13 de 29

ABC: Approximate Bayesian Computation

statistique paramètre

statistique observée

(14)

Page 14 de 29

ABC: Approximate Bayesian Computation

statistique paramètre

statistique observée

(15)

Page 15 de 29

ABC: Approximate Bayesian Computation

statistique paramètre

statistique observée

(16)

Page 16 de 29

ABC: Approximate Bayesian Computation

θ

0

θ

b

Distribution “postérieure” finale

(17)

Page 17 de 29

Example : histoire démographique de Medicago truncatula

K = 2

Plante autogame (s = 96%)

Milieux ouverts, perturbés

Populations très différenciées (forte dérive)

Répartition : bassin méditerranéen

Structure à grande échelle

(n=346, 13 locus microsatellites)

Proportion de variance expliquée proche de 10%

(18)

Page 18 de 29

Distribution des statistiques de diversité

30 locus (supposés) neutres

36 échantillons Ouest 33 échantillons Est

Biais des statistiques par rapport à des simulations neutres (sans structure, taille de populations stable)

observé simulations

(19)

Page 19 de 29

Modèles ABC

M

θ θ θ α

θ α

M

θ α 1 α 2 M

SNM

np=1

IM

np=2

PEM

np=2

IMG

np=3

IMiG

np=4

(20)

Page 20 de 29

Statistiques résumantes

Niveau de polymorphisme dans les deux populations

Spectre de fréquence conjoint (allèles minoritaires, par classe)

Total: 2 + 36 = 38 statistiques résumantes

(21)

Page 21 de 29

Phase d'échantillonnage

IM: 100 000 points échantillonnés

Distribution des statistiques simulées

valeur observée

(22)

Page 22 de 29

Phase d'ajustement - SNM

1% (1000) points acceptés

(23)

Page 23 de 29

Phase d'ajustement - IM

1% (1000) points acceptés

(24)

Page 24 de 29

Phase d'ajustement - PEM

1% (1000) points acceptés

(25)

Page 25 de 29

Phase d'ajustement - IMG

1% (1000) points acceptés

(26)

Page 26 de 29

Phase d'ajustement - IMiG

1% (1000) points acceptés

(27)

Page 27 de 29

Comparaison de modèles

Mélange de plusieurs modèles alternatifs

Phase de rejet uniquement (tolerance fixée)

Proportion des différents modèles parmi les points acceptés

sur 5X

100 000 points

(28)

Page 28 de 29

Comparaison de modèles - test a posteriori

Tirage d'un gène au hasard parmi les 30 (valeur observée)

Retirage de 1000 valeurs de paramètres (distribution nulle)

Test à 5% bilatéral

(29)

Page 29 de 29

Conclusion

Avantages de l'ABC :

- Souplesse des modèles

- Possibilité de tests statistiques

Précautions :

- Validation : modèles éloignés de la réalité ? - Effet confondants

- Importance du jeu de statistiques utilisé

Références

Documents relatifs

execute par exemple dans le cadre d'un projet mais avec des recenseurs diffe*rents, une enqu£te de type censitaire complete et une enqueue par sondage, .on.pourra comparer lee

Pays nettement engagé dans leur transition démographique et dans un processus de développement mais aussi caractérisé par le maintien de forte inégalité social qui concourt à ce

Les fragments neutres les plus courants sont en

1 - ​Pour les jeux de données fournis,​ ​représenter les nuages de points année en abscisse, population en ordonnée à l’aide de tableurs ou sur un papier millimétré..

1 - Les suites arithmétiques pour modéliser des évolutions linéaires On utilise une ​suite arithmétique​ pour modéliser l’évolution d’une population si ​la variation

2 Le groupe a établi les deux modélisations demandées et a fait une analyse critique comparée convaincante des modèles avec les données recueillies +1 Le groupe a utilisé

Pour cela, aller dans menu STATS, Edit, puis rentrer les données dans les listes L1 et L2... Pour cela, aller dans menu STATS, Edit, puis rentrer les données dans les listes L1

Après une seconde période de vingt-cinq ans, la population sera portée à quarante- quatre millions : mais les moyens de subsistance ne pourront plus nourrir que trente-trois