• Aucun résultat trouvé

Le modèle de Wright–Fisher

Chapitre 8

Introduction

Imaginons maintenant une population finie d’individus haploïdes, et intéres-sons nous à un gène concret de son génome, qui peut présenter deux allèles

aouA. Le modèle proposé indépendamment par Ronald Fisher [36] et Sewall Wright [86] étudie la variation de la proportion des allèles quand la popula-tion évolue. Dans le modèle de Wright–Fisher, la taille de la populapopula-tion,m, est constante au cours du temps. Pour passer d’une génération à la suivante, nous tironsmindividus au hasard, avec remise, de la population courante, que nous appelons lesenfants, et qui forment la nouvelle génération. Il s’agit donc d’une évolution où les différentes générations ne se superposent pas. Pour introduire la sélection dans le modèle, le tirage au hasard est fait en fonction de la fitness de chaque individu, et pour introduire les mutations, chaque enfant mute selon le noyau de mutation voulu. Le modèle de Wright–Fisher s’étend naturellement à une population avec un nombre fini quelconque de types.

Suivant les lignes proposées par Cerf dans [11], nous allons considérer le mo-dèle de Wright–Fisher dans le même cadre que le momo-dèle d’Eigen : un nombre fini de types avec une fonction de fitness et un noyau de mutation. Le modèle de Wright–Fisher décrit ci–dessus donne naissance à une chaîne de Markov. Sous des hypothèses raisonnables sur le paysage de fitness et le noyau de mutation, la chaîne de Markov de Wright–Fisher est ergodique, et nous pouvons donc nous intéresser à la distribution des types quand le nombre de générations tend vers l’infini (l’analogue des solutions stationnaires du système d’équations dif-férentielles d’Eigen). L’étude du processus de Wright–Fisher est nettement plus difficile que celle du processus de Galton–Watson, car la population constante

Ronald Fisher et Sewall Wright

introduit un couplage entre les différents individus. Nous allons donc nous concentrer sur le cas le plus simple : celui du paysage à un pic.

Pour retrouver un phénomène de seuil d’erreur et une distribution de quasi– espèce, il ne suffit pas cette fois–ci de considérer le régime asymptotique du modèle d’Eigen et du modèle de Galton–Watson (cf. la section 3.4). En effet, la présence d’un nouveau paramètre, la taille de la population, nous oblige à concilier le régime asymptotique du modèle d’Eigen et la limite des grandes populations ; la façon la plus naturelle de procéder est de considérer que la lon-gueur du génome et la taille de la population sont du même ordre. Ainsi, Cerf obtient une courbe critique séparant un régime de désordre et un régime de quasi–espèce [11]. Il obtient aussi la concentration de la master sequence dans le régime de quasi–espèce, qui coïncide avec la concentration de la master se-quence pour le modèle d’Eigen associé. L’objectif de cette partie est de montrer qu’il en est de même pour les concentrations des autres classes de Hamming. Nous pouvons distinguer deux comportements radicalement différents dans le processus de Wright–Fisher : quand la master sequence est présente dans la population et quand elle ne l’est pas. En effet, si la master sequence n’est pas présente dans la population, la population est neutre, et le processus de Wright–Fisher dédie son temps à explorer l’espace d’états de manière aléatoire. Le temps moyen pour retrouver la master sequence, le temps de découverte, est alors de l’ordre de la taille de l’espace d’états. Inversement, si la master se-quence est présente dans la population, et si sa fitness est assez grande, elle

125

met très longtemps à disparaître de la population, le temps moyen pour cette disparition est appelé letemps de persistance. La comparaison entre le temps de découverte et le temps de persistance donne lieu à la courbe critique mention-née. Pour retrouver les concentrations des différentes classes dans la distribu-tion de la quasi–espèce, il suffit donc de se concentrer sur la région sur–critique, et sur la dynamique du processus quand la master sequence est présente dans la population.

Dans le premier chapitre, nous présentons le processus de Wright–Fisher, nous énonçons le résultat principal de cette partie, et nous donnons quelques résul-tats de [11] utiles pour la suite. Une des principales difficultés est que la taille de l’espace d’états croît avec la longueur des genotypes (il y a de plus en plus de classes de Hamming). Pour surmonter cette difficulté, nous bornons ensuite la chaîne de Markov de Wright–Fisher par d’autres chaînes de Markov plus simples, dont l’espace d’états ne croît pas, même si la longueur du génome grandit. Le chapitre final porte sur l’étude de ces chaînes de Markov simplifiées. Dans le régime asymptotique que nous allons considérer, les trajectoires de ces chaînes de Markov se concentrent sur des trajectoires déterministes, données par un système dynamique. Le système dynamique en question est une version discrète du système d’équations d’Eigen, et les points fixes du système dyna-mique coïncident avec les solutions stationnaires du système d’Eigen. Nous avons donc deux points fixes, 0 et ρ, où ρ représente la distribution de la quasi–espèce : ∀k>0 ρk = (σea−1)a k k! X i>1 ik σi.

De plus, le point fixeρ attire toutes les trajectoires avec une condition initiale ayant la coordonnée 0 strictement positive. L’enjeu est de montrer que la me-sure invariante des chaînes de Markov simplifiées se concentre autour deρ. Le problème est que la mesure invariante est une fonction de toute la trajectoire du processus ; les chaînes étant ergodiques, elles sont ramenées près du point fixe 0 une infinité de fois et elles pourraient y rester longtemps. Nous nous inspi-rons de la théorie de Freidlin et Wentzell pour des perturbations aléatoires de systèmes dynamiques [38] pour contrôler les excursions des chaînes de Markov en dehors d’un voisinage deρ , et nous montrons ainsi que la longueur et la fréquence de ces excursions deviennent asymptotiquement négligeables.

Chapitre 9

Documents relatifs