• Aucun résultat trouvé

Déséquilibre gamétique et détection de QTL

N/A
N/A
Protected

Academic year: 2022

Partager "Déséquilibre gamétique et détection de QTL"

Copied!
4
0
0

Texte intégral

(1)

Dominique de Vienne 1

Déséquilibre gamétique et détection de QTL

Définition

Considérons deux locus bialléliques dans une population, l’un avec les allèles A1 et A2 de fréquences respectives p et q, l’autre avec les allèles B1 et B2 de fréquences respectives u et v.

Appelons f11 la fréquence de la combinaison gamétique A1B1, f12 la fréquence de A1B2, f21 celle de A2B1, enfin f22 celle de A2B2. S’il y a association au hasard des allèles dans la population gamétique, c’est-à-dire en cas d’indépendance statistique, les fréquences des gamètes sont données par le produit des fréquences des gènes. On aura donc :

f11 = pu, f12 = pv, f21 = qu et f22 = qv

S’il n’y a pas indépendance statistique, ces égalités ne sont plus vraies, et l’on peut écrire, par exemple pour le gamète A1B1 :

f11 = pu + D

où le paramètre D, appelé déséquilibre gamétique, mesure l’écart à l’association aléatoire dans la population pour ces deux gènes :

D = f11 − pu

On peut faire un tableau de contingence pour illustrer cet écart (attention, ce n’est pas un tableau de croisement) :

A1 A2 Fréquences marginales

B1 f11 = pu + D f21 = qu – D u

B2 f12 = pv – D f22 = qv + D v

Fréquences marginales p q

La valeur absolue de D est indépendante du gamète considéré, en vertu des relations f11 + f12 = p

f21 + f22 = q f11 + f21 = u f12 + f22 = v.

On peut en outre montrer que

D = f11f22 − f12f21.

La valeur absolue de D est comprise entre 0 (équilibre gamétique) et 1/4. En effet le déséquilibre maximum possible correspond au cas où la connaissance de l’allèle à un locus permet de prédire à

(2)

Dominique de Vienne 2 coup sûr l’allèle à l’autre locus, ce qui n’est possible que s’il n’y a que deux types de gamètes (A1B1 et A2B2, ou A1B2 et A2B1), et que ces gamètes sont en fréquence égale. Dans ce cas la relation D = f11f22 − f12f21, entraîne nécessairement |D| = 1/2 × 1/2 = 1/4.

En dehors de ce cas particulier, quelles sont les bornes du déséquilibre étant donné des fréquences alléliques données ? Pour le déterminer, il suffit d’utiliser le fait que les fréquences des gamètes sont nécessairement positives. Les relations

f11 = pu + D ≥ 0 f22 = qv + D ≥ 0 f21 = qu – D ≥ 0 f12 = pv – D ≥ 0 entraînent

max(– pu, – qv) ≤ D ≤ min(pv, qu).

Donc si D est positif, on a Dmax = min(pv, qu), et si D est négatif, on a Dmin = max(– pu, – qv).

Pour s’affranchir de la dépendance entre la fréquence des allèles et le déséquilibre de liaison, on utilise classiquement le paramètre

D’ = D/Dmax,

qui est compris entre 0 et 1 (si D est négatif, on fera le rapport D/Dmin). Par exemple, un déséquilibre D = 0,07 sera maximum dans une population où p = 0,1 et u = 0,3 (car alors Dmax = 0,07, d’où D’ = 1), mais il sera intermédiaire si p = 0,4 et u = 0,6 (D’ = 0,44).

Le déséquilibre de liaison peut aussi être exprimé en termes de corrélations entre les deux locus, en associant à chacun d’eux une variable indicatrice qui prend les valeurs 0 ou 1 selon l’allèle présent. On trouve alors facilement la relation suivante :

r2 = D2/pquv où r est le coefficient de corrélation entre les locus.

Causes

Plusieurs causes non-exclusives peuvent entraîner l’existence de déséquilibre de liaison dans les populations.

Le hasard : dans une population d’effectif limité, le tirage des gamètes qui vont former la génération suivante peut présenter par hasard un excès de tel ou tel type gamétique.

La sélection : certains types gamétiques sont sélectivement meilleurs que d’autres. Leur fréquence dans la population sera donc en excès.

La mutation : l’apparition d’une mutation dans une population en équilibre gamétique crée un déséquilibre gamétique, certes très faible. Mais le déséquilibre entre la mutation et les locus qui lui sont liés augmentera si la fréquence de l’haplotype portant la mutation augmente, ce qui peut se produire par hasard dans une population d’effectif limité, ou sous l’action de la sélection si la mutation est favorable. Cet effet d’entraînement de

(3)

Dominique de Vienne 3 gènes proches d’un gène sélectionné est appelé « l’auto-stop » génétique. La recombinaison va contrecarrer ce phénomène (voir ci-dessous).

La migration (ou le mélange de populations) : si une population uniquement constituée d’individus A1B1/A1B1 (D = 0) est mélangée à une population constituée d’individus A2B2/A2B2 (D = 0), la population résultante aura évidemment un déséquilibre non nul. Plus généralement, un déséquilibre gamétique sera créé chaque fois que des migrants proviendront d’une population ayant des fréquences alléliques différentes de celles de la population receveuse. Cette cause de déséquilibre gamétique est une source de difficultés lorsqu’il s’agit de détecter des QTL dans des populations quelconques (voir ci-dessous).

Les facteurs générateurs de déséquilibre gamétique sont donc ceux-là mêmes qui font varier les fréquences des gènes dans les populations.

L’expression déséquilibre gamétique est synonyme de déséquilibre de liaison, souvent utilisée.

Mais cette dernière expression peut prêter à confusion, puisqu’il peut exister du déséquilibre entre locus non liés génétiquement.

Evolution au cours des générations

Supposons une population avec un déséquilibre gamétique initial Do, dû à une cause quelconque.

En panmixie, et en l’absence de dérive, mutation, migration et sélection, les fréquences alléliques de cette population ne varieront pas. En revanche le déséquilibre gamétique va diminuer, selon une loi simple comme on peut le montrer en raisonnant par exemple à partir de la fréquence f11n du gamète A1B1à la génération n.

Ce gamète peut avoir deux origines :

Il provient sans recombinaison de la génération n – 1, avec la fréquence (1 – r) f11n – 1, où r est le taux de recombinaison entre A et B.

Il est issu d’une recombinaison (probabilité r), et dans ce cas la probabilité de tirer un gamète A1B1 est pu.

On a donc

f11n = (1 – r) f11n – 1 + rpu que l’on peut réécrire

f11n – pu = (1 – r) (f11n – 1 – pu) donc

Dn = (1 – r) Dn – 1 et

Dn = (1 – r)n Do

Le déséquilibre gamétique ne reste donc stable au fil des générations que si les deux locus sont totalement liés (r = 0), sinon il diminue d’autant plus vite que r est élevé. Mais il faut noter que même si les locus sont indépendants (r = 0,5), il ne sera que divisé par deux à chaque génération.

L’équilibre n’est donc atteint que progressivement, ce qui peut entraîner des erreurs d’interprétation dans la détection de QTL (voir ci-dessous).

(4)

Dominique de Vienne 4 Déséquilibre gamétique et cartographie de QTL

Que l’on utilise des descendances en ségrégation ou des populations quelconques, le principe de la cartographie de QTL à partir de marqueurs est toujours fondé sur l’exploitation de déséquilibres gamétiques.

L’avantage des descendances en ségrégation est que la mise en évidence d’une corrélation marqueur-caractère indique nécessairement qu’un QTL se trouve au voisinage du marqueur, car dans ce matériel le déséquilibre gamétique est directement relié au taux de recombinaison.

Considérons en effet un taux de recombinaison r entre deux locus A et B, et calculons le déséquilibre gamétique dans la population de gamètes issue d’un hybride F1 entre deux lignées fixées A1B1/A1B1 et A2B2/A2B2. On a f11 = (1 − r)/2, et comme p = 1/2 et u = 1/2, on a pu = 1/4.

D’où :

D = (1 − 2r)/4

qui est donc la valeur du déséquilibre dans la population F2 issue de l’autofécondation des individus F1 (ou de croisements F1 x F1). Si l’hybride F1 est à l’origine d’autres descendances (backcross, lignées recombinantes, etc.), et d’une manière générale dans toute descendance en ségrégation, l’expression du déséquilibre sera différente, mais on aura toujours une relation entre r et D.

Les choses ne sont pas si simples dans une population quelconque, où la mise en évidence d’une relation marqueur-caractère peut conduire à une conclusion erronée quant à la position du QTL car, nous l’avons vu, différentes causes peuvent entraîner un déséquilibre gamétique entre locus non liés génétiquement. Mais après un nombre suffisant de générations de panmixie et en l’absence de pressions évolutives, seuls subsisteront les déséquilibres gamétiques entre locus très proches. Ainsi pourra-t-on rechercher systématiquement les marqueurs au niveau desquels une différence significative peut être mise en évidence entre les moyennes des classes génotypiques.

Pour les caractères à seuil, on recherchera si les fréquences alléliques aux locus marqueurs sont les mêmes entre une sous-population d’individus exprimant le caractère (par exemple une pathologie) et un échantillon de la population ne l’exprimant pas. Ces méthodes sont indiquées dans les espèces où les croisements contrôlés sont difficiles ou impossibles (arbres, homme, etc.), pourvu naturellement que la position cartographique des marqueurs soit connue. A cet égard, le criblage fin du génome avec des marqueurs de type SNP est devenue une méthode privilégiée, connue sous le nom de « génétique d’association ». Mais la relation Dn = (1 – r)n Do n’est en général pas utilisable pour déterminer le taux de recombinaison marqueur-QTL, puisque ni le déséquilibre initial (Do), ni le nombre de générations n, ne sont connus. Toutefois avec une forte densité de marqueurs dans la région du QTL, et si n est grand, la précision de la position du QTL peut être très bonne. Enfin un moyen de s’assurer que la relation mise en évidence n’est pas artéfactuelle est d’avoir recours à au moins une autre population, puisqu’il est peu probable que les mêmes déséquilibres entre locus non liés se rencontrent dans deux populations différentes.

Références

Documents relatifs

M. A partir de larves récoltées dans la Mangrove guadeloupéenne les auteurs ont pu réaliser l’élevage en continu de Deinocerites magnus, espèce caractéristique des terriers

Comme attendu, les régions des gènes des caséines (chromosome 6) et de la β-lactoglobuline (chromosome 11) sont détectées lorsque les données ne sont pas corrigées pour

L’intérieur du socle établit certes un rapport de contre-pied avec le lieu de l’exposition, mais on pourrait difficilement admettre qu’il entre dans « une espèce de

Nous proposons alors des m´ethodes pour la d´etection et la localisation de loci et d’interactions entre loci ayant un effet significatif sur un caract`ere.. Abstract : A chromosome

On peut admettre des résultats des questions précédentes en le signalant.. Les résultats doivent être encadrés

II-1) Réaliser le circuit schématisé ci-dessous. Appeler le professeur avant de mettre sous tension pour qu'il vérifie le montage. II-2) Mesurer la valeur de l'intensité I G

- Le générateur de radon : fiole contenant du thorium 232 qui par désintégration successives donne du radium 224 qui par désintégration α donne du radon 220?. -

Intuitivement, c'est évident : si le polyèdre est assez "plat", l'aire immergée est voisine de l'aire de la base en lui étant inférieure, et l'aire totale est voisine de 2