• Aucun résultat trouvé

Chapitre II. CONCEPTS DE BASE DE GENETIQUE QUANTITATIVE

II. J. Déséquilibre de liaison et taille efficace

Le déséquilibre de liaison (DL, linkage disequilibrium) et la taille efficace (Ne) sont présentés ici car ils sont des paramètres importants de la précision de la sélection génomique, conditionnant l’association entre les loci contrôlant les caractères d’intérêt et les marqueurs moléculaires.

Le DL est l’association non-aléatoire entre les allèles de différents loci au sein d’une population. Plusieurs méthodes permettent de mesurer le DL (Weir, 1979, 1996; Slatkin, 2008; Russell et Fewster, 2009). Considérons deux loci avec le premier possédant un allèle A et le second un allèle B (quelque soit le nombre d’allèles par locus). Le DL se rattache à la grandeur DAB, qui est la déviation entre la fréquence observée de l’haplotype AB et sa fréquence attendue sous l’hypothèse d’indépendance des allèles A et B et de reproduction au hasard. Si la transmission des allèles est indépendante entre les deux loci, c'est-à-dire en équilibre de liaison, alors l’haplotype AB doit se rencontrer à une fréquence (pAB) égale au produit de la fréquence des deux allèles impliqués (pApB). Le déséquilibre de liaison entre les allèles A et B est l’écart entre la fréquence observée et la fréquence attendue :

DAB = pAB – pApB

DAB peut donc s’obtenir facilement à partir des fréquences haplotypiques. On note que pour des loci biallèliques DAB = –DAb= –DaB = Dab.

Dans la pratique ce sont souvent des données génotypiques qui sont disponibles. Dans ce cas, on utilise généralement ∆AB (delta de Burrow) au lieu de DAB. ∆AB peut se calculer à

partir de données génotypiques et sans faire l’hypothèse de reproduction au hasard. Dans notre exemple avec deux loci biallèliques, on a (Weir, 1979) :

∆      2

avec nAB un décompte des différents génotypes possibles (voir Russell et Fewster, 2009, p. 297), n le nombre d’individus échantillonnés et pA et pB la proportion d’allèles A et B dans l’échantillon. Un estimateur non biaisé de ∆AB s’obtient en tenant compte de la taille n de l’échantillon : ∆   ∆   (Weir, 1979). Comme DAB et ∆ sont sensibles aux fréquences allèliques, il est difficile de les utiliser pour comparer le DL entre différentes paires de loci. On les transforme donc en une grandeur standardisée (r) qui correspond au coefficient de corrélation entre les allèles des loci concernés. Par ailleurs comme r peut être

positif ou négatif, o e l’on s’intéresse à l’amplitude du DL.

Dans notre exe ple :

n lui préfère la grandeur r² lorsqu m , on a (Weir, 1996; Slatkin, 2008)  /  1 1 ) : ∆   1   1 et (Weir, 1996 . Plusieurs facteurs influencent le DL (Gupta et al., 2005; Mackay et Powell, 2007). Les facteurs augmentant le DL sont liés à la dérive, à la constitution de la population et à la sélection, naturelle ou artificielle : consanguinité, petite nombre d’individus (dérive génétique aléatoire), isolement reproductif entre groupes d’individus, mélange de populations (admixture), goulots d’étranglement (réduction extrême dans la taille de la population), etc. Le DL se réduit au fil des générations par les recombinaisons, qui rompent les haplotypes existants. Parmi les facteurs accélérant le rythme de réduction du DL, on trouve les régimes de reproduction privilégiant les individus non apparentés, un taux élevé de mutation, etc. D’autres facteurs peuvent augmenter ou diminuer le DL, selon les situations, ou peuvent augmenter le DL entre certains loci et le diminuer pour d’autres. Par exemple, les mutations peuvent aboutir à un DL élevé entre allèles mutants et à un DL faible entre allèles mutants et sauvages. Enfin, certains facteurs peuvent avoir un effet uniquement sur le DL de régions particulières du génome. Par exemple, les mutations favorables créent du DL au niveau local car les allèles mutants sélectionnés et des allèles neutres physiquement proches se répandent conjointement dans la population (autostop génétique ou genetic hitchhiking).

L’étendue du DL correspond à la distance physique (en paires de bases) ou génétique (en Morgans) en dessous de laquelle le DL est considéré comme significatif (par exemple supérieur à 0.1 lorsque l’on mesure le DL par le r² entre paires de marqueurs adjacents).

Pour les populations en équilibre de Hardy-Weinberg, les fréquences allèliques et génotypiques sont constantes, dans un état d’équilibre atteint en une seule génération, et il y a équilibre de liaison entre loci, atteint en quelques générations.

Cependant pour les populations dont la taille est finie les caractéristiques génétiques évoluent sous l’effet des changements aléatoires dans les fréquences allèliques au cours des générations (Caballero, 1994; Wang, 2005). Sur un grand nombre de loci la moyenne de ces changements est nulle, mais on peut calculer une variance des changements de fréquences allèliques. La fréquence d’un allèle à un locus atteindra finalement 1 (allèle fixé dans la population) ou 0 (allèle perdu). Cette évolution est décrite par le modèle de dérive génétique

de Fisher-Wright. Celui-ci suppose une population idéale, c-à-d de taille constante, avec des générations discrètes, se reproduisant au hasard, monoïque, de sexe ratio constant, avec une contribution égale de chaque individu à la génération suivante, sans mutation, sans migration et sans sélection. Dans ce modèle, la taille de la population (N) est le paramètre majeur conditionnant son évolution : le nombre de générations attendues avant la fixation d’un allèle à un locus est positivement corrélé avec N et la variance des changements de fréquences allèliques, le taux de réduction de l’hétérozygotie et le DL sont négativement corrélés à N. On peut utiliser ce modèle pour une population qui n’est pas idéale à condition de corriger N pour tenir compte des écarts existants entre les caractéristiques de la population réelle et les conditions idéales. Cette taille de population ajustée est la taille efficace Ne. Elle correspond à la taille d’une population idéale qui aurait donné lieu à la même dérive génétique aléatoire que la population réelle. Selon le paramètre génétique à partir duquel est mesurée la dérive génétique, il existe la Ne de variance (NeV), la Ne de consanguinité (NeC) et la Ne des coefficients de parenté (NeP). Il s’agit d’ajustements de N visant à ce que la variance des changements de fréquences allèliques (pour NeV) ou le taux d’accroissement de la consanguinité (pour NeC) ou de la parenté (NeP) observés dans la population réelle soient égaux à ceux d’une population idéale. A l’équilibre, NeV et NeC sont égaux.

Dans une population de Ne constante, l’approximation de l’espérance de la statistique r² de mesure du DL est 1 / (4Nec + 1), avec c le taux de recombinaisons entre loci en Morgans (Sved, 1971). Le DL peut donc servir à estimer Ne (Russell et Fewster, 2009). Dans une population isolée d’une espèce monoïque avec reproduction au hasard et des générations discrètes, pour des loci indépendants (c = 0.5), neutres et non liés à des loci sélectionnés, le DL provient exclusivement de la dérive génétique. Dans ce cas on peut estimer NeC avec la formule (Hill, 1981; Waples et Do, 2010, éq. 2) :

NeC ≈ 1 / ( 3 × ( E( ) – 1 / n ) ) [16]

avec basé sur l’estimateur non biaisé du delta de Burrow et n le nombre d’individus échantillonnés dans la population. Cette formule a fait l’objet d’une correction réduisant d’éventuels biais, par exemple pour les cas où NeC ou n sont petits (Waples, 2006, p. 174). NeC concerne ici la population des parents des individus échantillonnés. En utilisant des marqueurs liés et le taux de recombinaisons, le DL peut aussi être utilisé pour estimer NeC de générations passées (Hayes et al., 2003).

Il est aussi possible d’estimer Ne à partir du pédigrée. Dans une population idéale, la consanguinité moyenne à une génération donnée vaut Ft = 1 – (1 – ∆F)t et Ne = 1 / 2∆F (Falconer et Mackay, 1996). Gutiérrez et al. (2008, 2009) ont développé le concept de Ne réalisée, en considérant pour chaque individu i d’une génération t donnée l’augmentation de consanguinité ∆Fi qui s’est opérée depuis les fondateurs du pédigrée, telle que ∆ 1   1 . La Ne obtenue à partir des ∆Fi est une NeC moyenne sur la période couverte par le pédigrée. L’intérêt de leur approche est de tenir compte des déviations qui ont pu exister entre les caractéristiques de la population étudiée et celles d’une population idéale, telle qu’une reproduction non aléatoire ou une contribution différente des individus d’une génération à la suivante, sous l’effet par exemple de la sélection. Cervantes et al. (2011) ont étendu cette méthode au calcul de NeP.