• Aucun résultat trouvé

A - Mesures intra-population -Diversité génétique à un locus donné

Lorsqu’un gène en particulier est étudié, son séquençage apporte des informations basiques apportant une première idée de la diversité génétique de la population échantillonnée. On peut retrouver entre autres le nombre de sites polymorphes ou ségrégeants (S), le nombre d’haplotypes observés (H) ou le nombre moyen de différences observées entre deux séquences aléatoires de la population pour ce locus. La comparaison entre ce dernier et l’estimateur de diversité S permet via le D de Tajima de mettre en évidence l’effet d’une expansion démographique faisant suite à un goulot d’étranglement puisque dans une telle situation on s’attend à une perte du nombre de sites ségrégeants et une élévation du nombre moyen de différences entre séquence en raison du maintien de lignées aléatoirement conservées (Tajima, 1989). On peut aussi calculer le thêta de Watterson (Θw) qui correspond au nombre de sites ségrégeant rapporté à la taille de la séquence considérée (Watterson, 1975). Nombre moyen d’allèles par locus (A) ou allélisme, comme son nom l’indique, traduit la tendance moyenne

des locus d’une population en termes de nombre d’allèles. A l’inverse du polymorphisme, cet indice ne prend pas en compte les fréquences respectives des différents allèles. Cet indice est couramment utilisé en écologie de la conservation (Asins & Carbonell 1987 ; Bataillon et al., 1996). Le polymorphisme nucléotidique (π) correspond au nombre moyen de différences nucléotidiques par site et par paire de séquences (Nei 1987, Tajima 1983) est un autre moyen de quantifier la variabilité. Un autre avantage de cette méthode est que l’on peut distinguer le polymorphisme synonyme πs du non-synonyme πn lorsque l’on s’intéresse aux régions codantes du génome.

-Tajima

Le test de Tajima est un test statistique utilisé en génétique des populations. Le D de Tajima est calculé comme la différence entre deux mesures de la diversité nucléotidique : le nombre moyen de différences par paire de séquences à un locus dans une population et le nombre total de sites variables trouvé sur l’ensemble des séquences à ce même locus dans la même population. Ces deux estimateurs de la diversité génétique  telle que =4N.) sont égaux dans une population de taille constante et évoluant de façon neutre (D = 0). Ainsi pour un locus soumis à la sélection balancée, et donc où au moins deux allèles sont maintenus dans le polymorphisme, le nombre moyen de différences entre deux séquences va être plus élevé que l’attendu neutre puisque les allèles sous sélection ne recombinent pas et accumulent des mutations séparément. Dans ce cas, le D de Tajima prend des valeurs positives en raison d’une plus forte augmentation du nombre moyen de différences par paire de séquences.

Un effet démographique engendrant une réduction drastique de la taille de la population (ou goulot d’étranglement) conduit à un même effet sur le test de Tajima avec des valeurs significativement positives du test, mais à l’inverse de la sélection balancée qui n’affecte que le locus visé, un goulot d’étranglement aura une action généralisée sur le génome, et donc fournira des valeurs positives pour l’ensemble des locus.

A l’inverse, lorsqu’un locus est sous sélection purifiante ou subit un balayage sélectif, la sélection va conduire à une diminution du nombre moyen de différences entre deux séquences et a des valeurs négatives du D de Tajima. En particulier, avec un balayage sélectif, l’allèle associé à l’arrivée d’une mutation favorable va se répandre en quelques générations dans la population et éliminer le polymorphisme associé aux autres allèles. Ce processus évolutif est assez rare et dépend de la vitesse à laquelle les mutations apparaissent dans la population, et est

donc fortement dépendant de la taille efficace de la population. De ce fait, ces effets affecteront un nombre limité de locus. A l’inverse, une population subissant une expansion démographique après un goulot d’étranglement va se caractériser par un excès de nouvelles mutations en faible fréquence (singletons = 1/2N avec N= taille efficace). Cet excès de mutations rares est comparable à ce que l’on peut attendre d’un balayage sélectif mais cette fois affectera l’ensemble du génome. Dans notre analyse multilocus sur le génome, le nombre de locus présentant des valeurs de D significativement différentes de zéro nous permettra donc de trancher entre un effet démographique ou sélectif et le signe positif ou négatif de la différence entre estimateurs sur le mode de sélection ou l’effet démographique envisagé.

-Polymorphisme multi locus

La proportion de locus polymorphes (P), aussi appelée taux de polymorphisme ou polymorphisme correspond au nombre de locus variables par rapport au nombre total de locus étudiés. On considère généralement qu’une population est polymorphe à un locus donné si la fréquence de l’allèle le plus commun est inférieure à 0,95. En revanche cet indice ne permet pas de distinguer les locus polymorphes selon le nombre d’allèles ou d’allèles majoritaires. Taux d’hétérozygotie (he et ho)

Le taux d’hétérozygotie ou diversité génétique de Nei (1973) peut se définir en ho (hétérozygotie observée) qui correspond à la proportion observée d’individus hétérozygotes dans la population ou he (hétérozygotie attendue) correspondant à la proportion d’individus hétérozygotes sous l’équilibre d’Hardy-Weinberg. Pour n allèles d’un locus donné à la fréquence 𝑓𝑛 dans la population, l’hétérozygotie attendue est calculée avec la formule suivante :

𝑒 = 1 − (𝑓12+ 𝑓22+ 𝑓32+ ⋯ + 𝑓𝑛2) = 1 − ∑ 𝑓𝑛2 𝑛

𝑖=1

ou fn2 représente la fréquence des génotypes homozygotes. Si plusieurs locus sont considérés, on peut calculer l’hétérozygotie moyenne (He), représentant la moyenne arithmétique du taux d’individus hétérozygotes attendus pour chaque locus.

Indice de fixation (Fis)

Le Fis de Wright, initialement appelé coefficient de consanguinité (Wright, 1969), est obtenu avec la formule suivante : Fis = (he - ho)/ he = 1 – (ho/ he)

Avec ho, l’hétérozygotie observée et he l’hétérozygotie attendue, calculée à partir des fréquences alléliques sous l’hypothèse de Hardy-Weinberg.

Cet indice traduit le degré de différenciation génétique des individus au sein d’une population. Dans le cas d’une population à l’équilibre de Hardy-Weinberg on a he = ho et donc Fis = 0. Lorsque le taux d’hétérozygotie est supérieur à l’attendue, ce qui peut être le cas avec de la sélection balancée favorisant les hétérozygotes par exemple, he > ho et Fis est négatif. Enfin dans le cas d’un avantage aux homozygotes par exemple ou d’un effet Wahlund (mélange d’individus provenant de populations différenciées) on va observer un déficit d’hétérozygotes dans la population par rapport à l’attendue (he > ho) et le Fis sera d’autant plus proche de 1 que le phénomène sera marqué.

B - Mesures inter populations

De même que le Fis traduit la différenciation des individus au sein d’une population, Wright (1969) a aussi défini deux autres paramètres populationnels. Considérons un ensemble T formé de populations (ou sous-populations) S contenant des individus I. Wright a défini le Fit comme correspondant à la différenciation des individus au sein de l’ensemble considéré et le Fst comme indice de différenciation entre les populations. Le Fit est calculé de la même manière que le Fis en utilisant les hétérozygoties attendue et observée pour l’ensemble des individus (toutes populations confondues). Enfin la différenciation entre les populations est estimée à l’aide de la relation suivante (avec Fis étant une moyenne des Fis de chaque population considérée) :

Fst = 1 − 1 − Fit 1 − Fis

Cette liste non exhaustive d’outils permettant d’estimer la diversité génétique nous donne déjà un aperçu des possibilités qui s’offrent à nous. Certains indices peuvent être plus ou moins sensibles à des phénomènes démographiques ou au contraire à de la sélection, ce qui nous permet en les alliant et en résonnant par élimination de se faire une première idée des causes expliquant les patrons de diversité observés.