• Aucun résultat trouvé

La première phase d’une simulation génétique utilise la théorie de la coalescence, qui a été formalisée en 1982 par Kingman (1982a; 1982b), puis développée ultérieurement (Ewens 1990 ; Hudson 1990 ; Donnelly et Tavaré 1995 ; Nordborg 2001). Cette approche permet de reconstruire, en remontant dans le temps, la généalogie d’une série de gènes échantillonnés au présent jusqu’à leur ancêtre commun le plus récent, leur MRCA (Most Recent Common Ancestor, Figure 9.3).

Les "lignages" des gènes, ou leur généalogie, est reconstruite jusqu’au moment où deux d’entre eux possèdent un ancêtre commun. Il s’agit d’un "événement de coalescence". Cette coalescence a lieu dans un individu qui a transmis obligatoirement au moins deux copies d'un même gène à des descendants distincts. Après chaque coalescence, le nombre de lignages diminue d’une unité. Il est donc possible de continuer ce processus jusqu’au moment où il n’existe plus qu’un seul lignage, le MRCA. Le temps qui s’écoule du présent jusqu’au MRCA est appelé TMRCA (Time to the Most Recent Common Ancestor). Lorsque n gènes sont échantillonnés, n-1 événements de coalescence ont lieu. A la fin du processus, un arbre de coalescence est constitué, dont la racine est le MRCA et les branches terminales sont les gènes échantillonnés.

Figure 9.3. Exemple d'un arbre de coalescence de cinq gènes échantillonnés.

L’arbre de coalescence représente donc la généalogie des gènes, qu’il ne faut pas confondre avec une généalogie d’individus, même si les deux sont intimement liées (voir par exemple Excoffier 1997 ; Hurles et Jobling 2001 ; Nichols 2001). Chaque copie d’un gène possède une généalogie spécifique, dont aucune ne ressemble à celle des individus, comme l’illustre la Figure 9.4. Dans cette figure, les deux exemplaires du gène représenté par un rond noir, que l’on trouve à la génération 3, ont par exemple un ancêtre commun à la génération 1, alors que le gène représenté par un rond gris, ne laisse aucun descendant à la génération 3.

Figure 9.4. Schéma d’une généalogie d’individus diploïdes, pendant 3 générations (A), ainsi que les

généalogies de 4 copies différentes d’un gène (B).

Génération 1 Génération 2 Génération 3 Génération 1 Génération 2 Génération 3 A. Généalogie d’individus B. Généalogies de gènes événement de coalescence

Passé

lignages temps de coalescence gènes échantillonnés TMRCA

La généalogie d’un gène sélectivement neutre1 dépend uniquement de l’histoire démographique

de la population dans laquelle il se trouve et il est complètement indépendant du processus de mutation. L’étude de nombreuses généalogies de gènes neutres permet donc de faire des inférences sur l’histoire démographique de la population dans laquelle ils sont échantillonnés. L’intérêt principal de la théorie de la coalescence réside donc dans l’étude de la démographie d’une population à partir d’un échantillon de ses gènes. Il s’agit de l’avantage principal apporté par l’implémentation de l’approche par coalescence, par rapport à une approche "forward" (Livingstone 1989 ; Kaplan et al. 1991 ; Currat et al. 2002 ; Edmonds et al. 2004), puisqu’elle ne rend pas nécessaire la simulation de la totalité des gènes d’une population, mais seulement de ceux qui sont échantillonnés, ainsi que de leurs ancêtres. Le gain en temps de calcul et en espace mémoire est donc très important.

Figure 9.5. Schématisation du processus de coalescence aboutissant à un arbre de coalescence des gènes

échantillonnés, tel qu'il est implémenté dans SPLATCHE. Dans cette figure, 2 gènes sont, par exemple, échantillonnés dans le dème {1,1} mais leur coalescence a pourtant lieu dans un dème différent {1,2} à la génération -3. Ceci souligne la diffusion spatiale des lignages au cours du temps.

L’implémentation du processus de coalescence dans SPLATCHE se déroule de la façon suivante : lors de chaque génération, chacun des lignages simulés peut subir deux types d’événements : 1) une coalescence ou 2) une migration (Figure 9.5).

1Un gène neutre est considéré comme n’étant pas sujet à la sélection.

Cellules

{1,4}

{1,3}

{1,2}

{1,1}

6

5

1

2

3

4

0

Espace (2D)

Temp

s

= gène

= coalescence

= migration

Générations dans le passé

1) Evénement de coalescence :

Pour qu’une coalescence soit possible, il faut qu’au moins deux lignages se trouvent dans le même dème au même moment. Comme un dème avec N individus diploïdes contient 2N copies d’un gène donné, la probabilité d’avoir un ancêtre commun à la génération précédente est égale à 1/(2N) pour chaque paire de gènes présents dans ce dème. Si la population est haploïde, cette probabilité est égale à 1/N. La probabilité de coalescence Pc est donc inversement proportionnelle à la taille Nt de la population et dépend uniquement de cette dernière. Dans SPLATCHE, la densité Nt est tirée de la base de données virtuelle générée pendant la phase démographique. Si n lignages se trouvent dans un dème, alors il existe n n( −1) / 2 paires de lignages possibles. La probabilité d’avoir un événement de coalescence pendant cette génération devient n n( −1) / 4

( )

N lorsque la population est diploïde et n n( −1) / 2

( )

N lorsqu’elle est haploïde. Une seule coalescence par dème et par génération est possible dans SPLATCHE. Lorsqu’une coalescence se produit, alors le nombre total de lignages présents dans le monde virtuel est décrémenté d’une unité.

2) Migration :

Chaque lignage appartenant au dème i a une probabilité mij de migrer vers le dème voisin j au temps t. Cette probabilité se calcule comme

ji ij i I m N = (Eq. 9.1)

où Iji est le nombre d’immigrants qui sont arrivés dans le dème i depuis le dème j pendant la phase démographique et Nt est la densité de population du dème à la génération t. La migration d’un lignage de i vers j, en remontant dans le temps, correspond au fait que ce lignage a été apporté dans i par un immigrant venu de j. mij est calculée pour tous les voisins d'un dème (de un à quatre). Le nombre d’immigrants Iji provenant de chacun des dèmes voisins est tiré de la base de données générée pendant la phase démographique (somme des migrants venant des 4 points cardinaux, voir page 175).

Documents relatifs