Analyse du polymorphisme

1 _n2 L n He N N L  f  = − × _ − ÷_÷  

Les épisodes adaptatifs laissent des signatures spécifiques au sein du polymorphisme génétique au

voisinage génomique de la région où se trouvait l'allèle favorable. La stratégie utilisée pour

identifier ces régions part d'un principe simple : prédire les caractéristiques attendues du patron de

polymorphisme sous une hypothèse de neutralité (l'hypothèse nulle au sens statistique), et vérifier la

conformité des données observées le long du génome.

Cette stratégie, simple de prime abord, nécessite néanmoins de connaître la structure

populationnelle des données, d'en connaître les facteurs de structuration et les caractéristiques,

avant de pouvoir détecter les évènements de sélection. En effet, l'hypothèse de neutralité doit être

formulée sous la forme d'un modèle démographique correspondant à la population observée.

2.1. Modèles de génétique des populations

2.1.1. Notion de population

Le principe de la génétique des populations est l’étude des fréquences alléliques portées par les

individus au niveau de marqueurs génétiques distribués dans le génome, dans le but de comprendre

la biologie des populations, la spéciation et/ou l'évolution moléculaire. Cette discipline scientifique

s’intéresse aux caractéristiques de ces fréquences d’allèles au sein et entre les populations

d’individus sous forme de la variabilité génétique et de son partitionnement. Ces fréquences

alléliques sont en effet influencées par les caractéristiques des populations (structure spatiale, flux

géniques, histoire démographique) (Wright, 1931).

Le terme ‘population’ est très utilisé en biologie mais reste difficile à définir. Il est

généralement défini comme un groupe d’individus appartenant à la même espèce, localisé au même

endroit et au même moment et capables de se reproduire entre eux. A partir d’un échantillon

d’individus, la génétique des populations peut permettre de définir des populations a posteriori, de

caractériser ces populations et enfin d’inférer les paramètres démographiques et/ou historiques.

C’est dans ce cadre que de nombreux indices ont été définis sous deux catégories : les

indices intra-populationnels (décrire la répartition de la variabilité génétique des individus au sein

d’une population) et les indices inter-populationnels (décrire la répartition de la variabilité

génétique des populations entre elles). Ces différents indices sont résumés dans l’encadré 1 Ils vont

permettre principalement deux choses. Tout d’abord, une vision descriptive de l’échantillon

permettant d’identifier son polymorphisme. Ensuite, une vision populationnelle quantifiant la part

de la variance génétique expliquée par la structure populationnelle (souvent extrapolée comme un

indice de différenciation génétique entre populations) (Halkett et al., 2005).

2.1.2. Les facteurs d'évolution des populations

L’évolution agit sur les populations via cinq forces évolutives : la dérive, la sélection, la migration,

la mutation et la recombinaison. Nous n'aborderons ici que les effets de ces forces au niveau

populationnel, car leurs effets moléculaires peuvent être assez différents. Ces cinq forces peuvent

être définies de la manière suivante :

La dérive génétique correspond à la variation aléatoire des fréquences alléliques au sein

d’une population de taille finie au cours des générations. Cette force va donc fixer, de manière

aléatoire, des allèles neutres voire légèrement délétères dans les populations, mais la plupart des

allèles créés par la mutation ou apportés par la migration seront éliminés au fil des générations car

ils sont initialement en fréquence faible. La dérive conduit donc à la perte de variations génétiques

au sein des populations.

La sélection correspond à l’ensemble des phénomènes qui augmentent ou diminuent la

fréquence d'un phénotype en raison de l’adaptation des individus à leurs environnements. Il existe

trois types de sélection sur le phénotype :

La sélection stabilisante maintient les phénotypes optimaux au détriment de la diversité.

Cette force favorise un optimum unitaire au sein de la population. Son effet le plus important est

donc d’éliminer les génotypes nouveaux apparaissant par mutation ou migration. Ainsi, dans un

environnement stable, une population ayant atteint un haut niveau d'adaptation maintient les

génotypes les plus adaptés au fil des générations.

La sélection directionnelle favorise également un optimum au sein de la population, mais en

générant un décalage systématique des fréquences alléliques dans une certaine direction. Cette force

est effective, chez des populations évoluant dans un environnement se modifiant de manière

constante, et aboutit à un nouvel état d'adaptation.

14

Encadré 1: Paramètres de génétique des populations

La génétique des populations a pour but d’étudier la variabilité génétique et son partitionnement entre

individus et entre populations. De ce fait, les paramètres calculables peuvent être divisés en deux

catégories selon le niveau d’organisation considéré : les paramètres intra-populationnels qui reflètent

la diversité génétique au sens large, et les paramètres inter-populationnels qui permettent de

quantifier les différences de fréquences d’allèles entre populations.

Les paramètres intra-populationnels Les paramètres inter-populationnels

N : Correspond à la taille de la population

(nombre d’individus). A ne pas confondre avec

Ne (taille efficace de la population).

G/N : Correspond au nombre de génotype

ramené au nombre d’individu par population

(correspond donc à la richesse en génotype

d’une population).

Ho (observed heterozygosity) : Correspond à

l'hétérozygotie observée au sein d’une

population. Elle est calculée à partir de la

fréquence des individus hétérozygotes (nombre

d’individus hétérozygotes divisé par la taille de

la population N).

He (expected heterozygosity) : Correspond à la

fréquence théorique des hétérozygotes d’une

population (diversité génétique de Nei [1973]).

Elle est calculée à partir des fréquences