Génétique quantitative : notions de base
Dominique de Vienne, Université Paris-Sud Génétique Quantitative et Evolution – Le Moulon
Ferme du Moulon, 91190 Gif-sur-Yvette devienne@moulon.inra.fr
http://moulon.inra.fr/~ddevienne/UE_GPP_2016-2017
Plan
§ La génétique quantitative : les principaux concepts et leur histoire
§ La plasticité phénotypique et les normes de réaction
§ La complexité de la relation génotype-phénotype
§ La modélisation de la variation phénotypique. Notion d’héritabilité et de réponse à la sélection
§ A la recherche des gènes à effets quantitatifs (QTL,
Quantitative Trait Loci) : le déséquilibre de liaison et son
exploitation.
La génétique quantitative : les principaux
concepts et leur histoire
La variation continue
Pomme de terre Piment/
poivron Chou Tomate
Melon
La variation continue
54,6 cm 2,51 m
Variation de la taille chez l'homme
- Génétique quantitative (génétique « statistique »),
« a statistical branch of genetics based upon fundamental Mendelian principles extended to polygenic (multilocus) characters, [in which] most final formulations are phrased in
terms of phenotypic means and variances. »
- Génétique multifactorielle
- Génétique des caractères à déterminisme complexe
Quantitative traits
Continuous variation: the traits are measured:
Growth rate, flowering date, fruit pH, behaviour traits, morphological traits, blood pressure, metabolic flux, enzyme activity, mRNA/protein concentrations, etc.
« Complex » traits in quantitative genetics
Threshold traits
Survival to a fixed age, diseases, hatching, etc.
Meristic traits
Discontinuous variation: sum of distinct entities
Number of bristles in Drosophila, number of grains/ear, litter size, leaf number in plants, scale counts in fish, etc.
Nota: categorial traits (ex. coat colour)
« Gènes du comportement »
Paresse
Appétence pour le gras, les sucres, l'alcool
Orgueil Avarice Infidélité Agressivité et viol Sentiment de bien-être
Homosexualité, etc.
Ce n’est pas parce que c’est publié que ce n’est pas n’importe quoi
Jiri Suruvka, 1961
Johnson et al. Nature Neuroscience 19, 223–232 (2016)
Epilepsie Autisme
Schizophrénie Retard
intellectuel
Exemples de distributions normales pour des caractères quantitatifs
A
0 1 2 3 4 5 6 7
150 160 170 180 190 200Taille (cm)
N
Stature de 423 961 hommes
âgés de 17 à 27 ans Teneur en saccharose dans la racine de betterave (n = 42 997)
µ = 175,14 cm
σ = 6,78 cm
f(x) =
Taille des portées chez le rat
Exemple de distribution normale
pour un caractère méristique
Caractères polygéniques à seuil
0 0,005 0,01 0,015 0,02 0,025 0,03 0,035 0,04
1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97
Fréquence
Prédisposition
Sains
Seuil
Malades
Mais aussi…
Log normale
Concentration en hydroxymethylfurfurol
(1573 échantillons de miel). BioScience, 51:341 (2001)
Approche biométrique de l'hérédité des caractères quantitatifs
Hérédité « mélangée » (Darwin, 1859)
§ Réfutée dès 1867 (Fleeming Jenkin) :
§ Souvent (…) le père et la mère ne se distinguent que par (…) un caractère. Dans ce cas, la règle du mélange n'a plus de valeur. Et même si les parents se distinguent dans deux ou trois qualités, il se peut que (…) l'hybride montre une qualité du père, une autre de la mère, sans mélange. Ces cas ne pouvaient pas échapper aux observateurs judicieux, mais ils ont été traités comme des exceptions à la règle générale.
Hugo De Vries. 1900. Sur les unités des caractères spécifiques, et leur application à l'étude des hybrides. Revue générale de botanique, 12, 259-271.
Var P
enfant= 1/4 [Var(P
père+ P
mère)] = 1/2 VarP
P
enfant= 1/2 (P
père+ P
mère)
Hérédité « ancestrale » (Sir Francis Galton, 1822-1911) : interprétation de la régression parent-enfant
Approche biométrique de l'hérédité
des caractères quantitatifs
La régression parent-enfant (Galton, 1886)
Taille enfant
Taille parent moyen
205 couples 928 enfants
La relation parents-descendants
§10. “Experiments with Hybrids of Other Species of Plants”
Phaseolus nanus (white flowers) x Phaseolus multiflorus (purple-red flowers).
“Versuche über Pflanzen-Hybriden”
G. J. Mendel, 1865
“Enigmatic results”: whole series of colors, from white to purple
Approche génétique
L'hypothèse de Mendel
sur ses résultats "énigmatiques"
« Si la couleur des fleurs A était composée de caractères indépendants A1 + A2 + ... donnant comme effet d'ensemble une coloration rouge, il devrait se former par fécondation avec le caractère différentiel couleur blanche a, les combinaisons hybrides A1a + A2a +..., [...] chacune étant indépendante des autres.
On voit donc facilement que, de la combinaison des différentes séries des formes évolutives, devrait provenir une série complète de couleurs.
Si, par exemple, A = A1A1+ A2A2, alors les hybrides A1a et A2 a forment les séries [...] :
1A
1A
1+ 2A
1a + 1aa
1A
2A
2+ 2A
2a + 1aa
L'hypothèse de Mendel
Les chiffres placés devant chaque combinaison indiquent aussi combien il y a, dans la série, de plantes avec la coloration correspondante : il y en a au total 16. Donc, sur la moyenne, chaque groupe de 16 plantes comprendra toutes les couleurs, mais […]
dans des proportions inégales ».
1 A
1A
1A
2A
2[4] 2 A
1a A
2A
2[3] 1 aa A
2A
2[2]
2 A
1A
1A
2a [3] 4 A
1a A
2a [2] 2 aa A
2a [1]
1 A
1A
1aa [2] 2 A
1a aa [1] 1 aa aa [0]
« Les membres de cette série peuvent donner 9 combinaisons différentes, chacune d'entre elles montrant une couleur spécifique :
Two independent factors, A-a et B-b, with A or B: + 1 “dose” of red) The Mendel's hypothesis to explain his “enigmatic results”
A B x a b
⊗
F2
A B a b
A B a b
« Nous apprendrions vraisemblablement par là à comprendre l'extraordinaire diversité du coloris de nos plante d'ornement ».
Distribution des valeurs génotypiques dans une population F
2Deux locus indépendants, bialléliques, A/a et B/b, sans dominance ni épistasie
A : +1 B : +1 A
A B
B a
a b
x b
A
a b B
⊗
F2
AaBb aaBB AAbb
AABb AaBB
AABB Aabb
aaBb
aabb Fréquence
Valeur du caractère
Conséquence : distribution continue des valeurs génétiques dans
une population
Conséquence : distribution continue des valeurs génétiques dans
une population
Conséquence : distribution continue des valeurs génétiques dans
une population
Conséquence : distribution continue des valeurs génétiques dans
une population
Conséquence : distribution continue des valeurs génétiques dans
une population
Conséquence : distribution continue des valeurs génétiques dans
une population
Conséquence : distribution continue des valeurs génétiques dans
une population
Conséquence : distribution continue des valeurs génétiques dans
une population
Conséquence : distribution continue des valeurs génétiques dans
une population
Conséquence : distribution continue des valeurs génétiques dans une population
La loi binomiale
tend vers la loi normale
Hum… Les choses sont un peu plus compliquées
Théorème central limite :
Si l'on fait la moyenne arithmétique
Y = (X1 + X2 + ... + XN)/N
de N variables aléatoires indépendantes (ayant même loi, quelle qu'elle soit), d'espérance m et de variance
σ
2 , alors les fluctuations de Y par rapport à la moyenne m sont distribuées selon une gaussienne, lorsque N est grand.Généralisations
Il existe plusieurs généralisations qui ne nécessitent pas des lois identiques mais font appel à des conditions qui assurent qu'aucune des variables n'exerce une influence significativement plus importante que les autres. Une dépendance « modérée » est également autorisée.
Donc, si une variable est la résultante d'un grand nombre de causes, à faible effet, cette variable suit une loi normale.
0 10 20 30 40 50 60 70 80 90
1 2 3 4 5 6 7 8 9
0 5 10 15 20 25 30 35
1 2 3 4 5 6 7 8 9 10
Théorème central limite : exemple
Loi de X
1, X
2, ..., X
N: uniforme
Distribution de Y
(N = 6)
Approche génétique
La variation continue peut être maintenue par la ségrégation indépendante de facteurs multiples (mathématiquement formalisé dès 1902 par un mathématicien anglais, G. Udny Yule)
de Vries H. 1900. Sur les unités des caractères spécifiques et leur application à l'étude des hybrides. Revue générale de botanique, 12, 259-271.
Redécouverte des résultats de Mendel
Biométriciens vs. Mutationnistes
Redécouverte lois de Mendel (1900)
K. Pearson, W.F.F. Weldon H. De Vries, W. Bateson
Biométriciens Mutationnistes
Expériences de G.H. Schull (1908), H. Nilsson-Ehle (1909), East (1915), etc. :
Effet uniformisant de l'autofécondation, grande diversité de génotypes, atavisme,« explosion » de variabilité en F2
Expériences de Wilhelm Johannsen (1903, 1909)
Notions de lignée pure, de génotype et de phénotype
D'accord sur un point, l'incompatibilité de la génétique mendélienne et de l'hérédité des caractères quantitatifs !…
L'expérience de Johannsen (1903)
[inventeur du mot « gène »]Notion de lignée pure, puis de
génotype et
de phénotype
(1909)
Génotype et phénotype
Génotype Constitution génétique d'un individu. Dans un sens plus restreint, c'est la composition allélique d'un ou de plusieurs locus étudiés chez un individu.
Phénotype [
Petit Robert : du grec phainein « paraître » et –type]
Expression du génotype dans un environnement donné. C'est la
manière dont nous apparaît un individu, ou un caractère particulier,
dans cet environnement.
Watson & Crick 1953, etc.
Gènes Enzymes Phénotypes La relation génotype-phénotype
Point de vue de la biologie moléculaire
Gènes-enzymes Phénotypes
A. E. Garrod, 1902-1909
La relation génotype-phénotype
Point de vue de la génétique et l'évolution
Allèle 1 Phénotype P1 Allèle 2 Phénotype P2
On ne fait pas de la génétique des caractères,
mais des variations des caractères
Biometricians vs. Mutationists (« Mendelians »)
Rediscovery of Mendel's laws (1900)
K. Pearson, W.F.F. Weldon H. De Vries, W. Bateson
« Biometricians » « Mutationists »
G.H. Schull (1908):
Self-fertilized strains are phenotypically uniform, which is consistent with Mendelian bases.H. Nilsson-Ehle (1909):
Three-locus segregations, with 63:1 ratios (1/26=1/64) ⇒ huge diversity of genotypes.East (1910, etc.):
Atavism. Outbreak of variation in F2, resulting form the segregation of multiple genotypes from the F1 heterozygotes.Wilhelm Johannsen experiments (1903, 1909):
Concepts of pure line, genotype and phenotypeThey only agreed on the incompatibility of Mendelian Genetics and the inheritance of continuous traits !…
F2
RIL IRIL
Multiparent Advanced
Generation InterCross (MAGIC) BC
NIL
Bergelson & Roux, 2010, Nature Review Genetics
Multiparent Advanced Generation InterCross (MAGIC)
Descendances couramment
utilisées en génétique
Bergelson & Roux, 2010, Nature Review Genetics
MAGIC: Multiparent Advanced Generation InterCross
HIF: Heterogeneous Inbred Family RIL: Recombinant Inbred Lines
IRIL: Intermated Recombinant Inbred Lines BC: Back-Cross
NIL: Near Isogenic Lines
PI 414723
F1 Védrantais
« Explosion » de variabilité dans des lignées
recombinantes de melon
Longueur de la fleur (mm) East, 1915
σ = 1,5 σ = 2,2
σ = 6,4 σ = 2,8
« Explosion » de variabilité dans les descendances
Deux lignées de tabac
La notion de milieu (ou environnement)
Milieu
Ensemble des causes non (épi)génétiques de variation (lieu, année, effet maternel, traitement, état physiologique, âge, etc.)
Macro-milieu Micro-milieu Variation Identifiée
Contrôlée ou non Mesurée
Non identifiée Non contrôlée Non mesurée
Analyse de variance
Facteur Résiduelle
Des individus différents de même génotype ont rarement le même phénotype
110 120 130 140 150
0.000.100.200.30
Hauteur des plantes de lignées de maïs
cm
Fréquence
lignée2 lignée1
Le micro-milieu
Control Saline Drought Cold Heat
Le macro-milieu
Les notions de plasticité
phénotypique et de norme de réaction
« Plasticité » phénotypique
Milieu
1 2
Ph.
FaibleMilieu
1 2
Forte
Ph.
The ability of an organism with a given genotype to change its phenotype in response to changes in the environment is called
phenotypic plasticity.
Exemples de plasticité
- Différences morphologiques chez les insectes sociaux - Phénotypes de plantes à différents niveaux
d'irrigation
- « Thrifty » [« économes »] phenotypes
(cf. diabète type II, maladies cardiovasculaires)
- Temps de développement d'insectes phytophages sur différentes
espèces d'hôtes
Normes de réaction
Une norme de réaction est l'ensemble des phénotypes que présente un génotype dans une gamme de milieux.
(the function relating phenotypic response of a genotype to a change in the environment) (Wolterek, 1909,
Schmalhausen 1949)
« Robustesse »,
« canalisation » ou
« homéostasie »
Interaction génotype-environnement
Félix M. A. and Barkoulas M.
NATURE REVIEWS | GENETICS VOLUME 16 | AUGUST 2015 | 483
Robustness in biological systems
Variable x : macro-milieu Variable y : génotype
La variance aussi peut être plus ou moins robuste
Si la norme de réaction dépend du génotype, il y a interaction GxE
P = µ + G + E + GE + e ⇒ VarP = VarG + VarE + VarGE + Vare
Interactions génotype-environnement (GxE)
E1 E2
P
Effet d'échelle
E1 E2
P
Pas d'interaction
E1 E2
P
Inversion de classement
( ! conséquences sélectives)
Interactions génotype
Xmilieu
(G
XE)
Riz
Rat Tabac
Carpe
Veau Poule
La complexité de la relation génotype-phénotype
Il n’y a pas de relation bi-univoque entre un gène et un caractère :
– Un caractère peut être affecté par plusieurs gènes
– Des individus de même génotype peuvent avoir des phénotypes différents
– Pléiotropie. Ex. : une mutation « yeux blancs » affecte aussi la durée de vie de la mouche et son comportement.
– Epistasie. Ex. : si la mouche est homozygote white/white au locus 1, on ne distingue pas les différents génotypes (allèles vermilion et pink) au locus 2.
La complexité de la relation génotype-phénotype
Le gène Orange, lié au sexe X
BX
BX
OX
OX
BX
OX
BY X
OY
Le cas idéal : P = G
Relation phénotype-génotype
Le cas le plus fréquent : P ≠ G
Un génotype, des phénotypes ou
Un phénotype, des génotypes
Des individus différents de même génotype
ont rarement le même phénotype (ici effets de micro-milieu)
0 200 400 600 800 1000
6.06.57.07.58.0
Croissance d'une souche de levure
Temps (mn)
Nb de cellules
rep1 rep2 rep3
Un génotype, des phénotypes
Variation des traits d’« histoire de vie » chez 12 souches de levure selon la teneur en glucose du milieu de culture (ici effets de macro-milieu)
Nombre de cellules x 107
Taux de consommation du glucose x 109 15%
1%
0.25%
Spor et al., PLoS One, 2008
Un génotype, des phénotypes
Des génotypes, un phénotype
Le polymorphisme au niveau de l’ADN a rarement des effets phénotypiques => niveaux emboîtés de dégénérescence :
– dégénérescence du code génétique
– dégénérescence structure primaire => structure secondaire pour les ARNt – acides aminés de même propriétés chimiques
– relation entre flux métabolique et activité des enzymes : non linéaire – fonctions redondantes
Notion de « neutralité » phénotypique et sélective
des polymorphismes moléculaires (M. Kimura)
Code génétique
Tableau inversé
Genotype : sequence
Phenotype :
secondary structure of pairings
Fontana & Schuster, JTB (1998)
Au niveau de l’ARNt
Des génotypes, un phénotype
Génotypes Phénotype
Au niveau de l’ARNt
Des génotypes, un phénotype
Fontana & Schuster, JTB (1998)
Séquence Structure IIre
Genotype
Phenotype
tRNA Sequence
Secondary structure of pairings
folding
References Fontana & Schuster (1998) Lipman & Wilbur (1991) Ciliberti, Martin & Wagner (2007)
Très souvent, des génotypes différents conduisent à un même phénotype
Protein sequence
Three dimensional structure
Regulatory circuit
Gene expression levels
Des génotypes, un phénotype
E
1E
2E
jE
nX
0S
1…
S
jS
j+1…
X
nLa relation entre les flux métaboliques et les activité des enzymes n’est pas linéaire.
Des génotypes, un phénotype
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
0,55 0,6 0,65 0,7 0,75 0,8 0,85 0,9 0,95 1
Paramètre enzymatique
J
E
iEffet phénotypique négligeable
nt821(del11)/nt821(del11)
nt419(del7-ins10) Q204X
E226X nt821(del11)
C313Y E291X
+/+ E291X / E291X C313Y/C313Y E226X/E226X Q204X/Q204X E226X/nt(del7-ins10)
Différentes mutations du gène Myostatin
conduisent au caractère
« culard »
Des génotypes, un phénotype
PP ou Pp ?
Les effets génétiques : la dominance
Groupe sanguin A : AA ou AO ?
Des génotypes, un phénotype
En génétique mendélienne. William Bateson (1908) :
« L’action d’un locus masque l’effet allélique à un autre locus (de la même manière que la dominance complète implique le masquage d’un allèle par un autre) ». ⇒ Ségrégations irrégulières :
Les effets génétiques : l’épistasie
Des génotypes, un phénotype
En génétique quantitative et évolution. R. A. Fisher (1918) :
« Il n’est pas toujours possible de prédire le phénotype quantitatif d’un génotype particulier à deux locus en additionnant simplement les effets des locus ensemble ».
Dominance : “Interaction intra-locus”
Epistasis : “Interaction Inter-locus”
L'épistasie
1 + 1 ≠ 2
Epistasis: Axillary
inflorescences of four NILs
(Lukens & Doebley, 1999)
1cm Low density
growth
T1-T3 M1-T3
T1-M3 M1-M3
High density growth
M1-M3 T1-M3 M1-T3 T1-T3
Ch. 1 Ch. 3
Maïs Téosinte
La modélisation de la variation phénotypique :
notions d’héritabilité et de réponse à la sélection
Sir Ronald Aylmer Fisher 1890-1962
Ronald A. Fisher, 1918 : décomposition de la variance phénotypique ⇒ héritabilités
P = µ + G + e
effet du (micro)milieu valeur phénotypique valeur génotypique
P, G et e sont des variables aléatoires P ~ N(µ, σ
2P) avec µ = E(P) et σ
2P= Var(P)
G ~ N(0, σ
2G) et e ~ N(0, σ
2e)
Ronald A. Fisher, 1918 : décomposition de la variance phénotypique ⇒ héritabilités
P = µ + G + e
effet du (micro)milieu
Var P = Var G + Var e
Car Var µ = 0 et Cov Ge = 0 : l'effet du micro-milieu ne dépend pas du génotype
valeur phénotypique valeur génotypique
Héritabilité au sens large
H
2(ou h
sl2) = Var G Var P
Part de variance phénotypique d'origine génétique (0 ≤ H
2≤ 1)
15%$
79%$ 85%$
21%$
Forte Faible
Var G Var e
Var e
Héritabilité au sens large
H
2= VarG VarP
Comment estimer les deux composantes de la variance phénotypique ?
⇒ répétitions des génotypes (clones, lignées pures) : les différences entre répétitions d'un même génotype permettent d'accéder à la part de
variance qui n'est pas d'origine génétique. Méthode statistique : ANOVA
P
Variance inter-classes
=> Var G Variances intra-classe
=> résiduelle : Var e
Quatre génotypes
Principaux paramètres statistiques utilisés pour caractériser une ou deux variables
Héritabilité au sens large H G
² = Var P Var Cas particulier important : deux répétitions pour
une série de génotypes (jumeaux monozygotes)
r PP
P P
= Cov Var Var
' '
Cov PP' = Cov (G + e, G + e')
Attention !
Cov ee' = 0 si et seulement si il n'y a pas d'effet milieu commun.
r G
P H
= Var =
Var ²
Héritabilité au sens large
Coefficient de régression du génotype sur le phénotype
H
2: coefficient par lequel il faut multiplier la valeur phénotypique centrée pour avoir une estimation de la valeur génotypique
G ˆ = b
GP( P − µ )
bGP = Cov(G,P −
µ
)VarP = VarG
VarP = H2
G ˆ = H
2( P − µ )
Héritabilité au sens large
Coefficient de régression du génotype sur le phénotype Gˆ = H2
(
P−µ)
La plus grande dispersion des valeurs phénotypiques vient des
effets de milieu : à une valeur génotypique donnée, plus ou moins éloignée de la moyenne, peut correspondre par hasard une
valeur phénotypique encore plus éloignée.
La prédiction de la réponse à la sélection
Sélection naturelle : pas de seuil strict Sélection artificielle : seuil strict
R S
µS
S = µS – µ
R = µR – µ
µR
L'espérance de la valeur génotypique GS du groupe d'individus sélectionnés est :
E(GS) = H²(µS – µ)
Comme la valeur génotypique est la seule qui se transmette, E(GS) exprime également l'écart entre la valeur phénotypique moyenne des d e s c e n d a n t s d e s i n d i v i d u s sélectionnés, µR, et celle d'individus tirés au hasard dans la population, µ.
L'écart ΔG = R = µR – µ, appelé progrès génétique ou réponse à la sélection est donc :
ΔG = R = H²(µS - µ)
Réponse à la sélection chez les espèces à reproduction végétative et chez les espèces autogames
R = H
2S
Héritabilité au sens large
Quatre interprétations
§ Part de variance phénotypique d'origine génétique => H
2= VarG/VarP
§ Coefficient de corrélation entre deux répétitions d'un même génotype => r = H
2si pas d’effet milieu commun
§ Coefficient de régression linéaire du génotype sur le phénotype => b
GP= H
2§ Paramètre qui permet de prédire la réponse à la sélection chez
les espèces à reproduction végétative et chez les espèces autogames
=> R = H
2S
Héritabilité au sens large
Quatre interprétations
§ Part de variance phénotypique d'origine génétique
§ Coefficient de corrélation entre deux répétitions d'un même génotype
§ Coefficient de régression linéaire du génotype sur le phénotype
§ Paramètre qui permet de prédire la réponse à la sélection chez
les espèces à reproduction végétative et chez les espèces
autogames.
Héritabilité au sens étroit
Var P = Var A + Var D + Var I + Var e
L'héritabilité au sens large n'est pas suffisante pour modéliser la réponse à la sélection : un individu ne transmet à sa descendance qu'un des deux allèles à chaque locus, si bien qu'aucun effet de dominance ne se transmet, et une petite part seulement des effets d'épistasie.
On décompose donc la valeur génotypique G en trois contributions : - l'ensemble des effets moyens des gènes, A (valeur génétique additive) - l'ensemble des interactions entre gènes allèles, D (valeur de dominance) - l'ensemble des interactions entre gènes non allèles, I (valeur d'épistasie)
A + D + I
P = µ + G + e
h A
² = Var P Var
Héritabilité au sens étroit
h
2représente la fraction de la variance phénotypique dont on peut prédire la transmission (comprise entre 0 et 1)
Comment l'estimer ?
⇒ Mesure de la ressemblance (covariance) entre apparentés
Part de variance phénotypique d'origine génétique additive
Relation entre la taille de la mère et celle de ses enfants
y = 0.62 x
-20 -10 0 10 20
-20 -10 0 10 20
Taille de la mère
taille des enfants
Relation entre la taille du père et celle de ses enfants
y = 0.56 x
-20 -10 0 10 20
-20 -10 0 10 20
Taille du père
taille des enfants
Relation enfant - un seul parent : h ˆ
2≈ 2 b
fpEtude d’un cas particulier important :
la relation parent-enfant
Relation entre la taille moyenne des parents et celle de leurs enfants
y = 0.825 x
-20 -10 0 10 20
-20 -10 0 10 20
Taille moyenne des parents
(données fournies par Anne Atlan et recueillies entre 1995 et 2000 chez des étudiants de DEA. Les données ont été centrées pour
chaque sexe dans chaque génération)
taille des enfants
h ˆ
2≈ b
fpRelation enfant –
moyenne des parents :
Héritabilité au sens étroit
Méthode : estimation des corrélations entre apparentés à partir de dispositifs familiaux plus ou moins complexes
Cov P P 1 2 = 2 φ Var A u + Var D
⇒ Composantes de la variance phénotypique
Remarque : le coefficient de régression linéaire, bfp, est aussi égal au coefficient de corrélation parent-enfant :
rpf = CovPpPf
VarPpVarPf = CovPpPf
VarP = bpf
Plus généralement la corrélation entre apparentés fournit un moyen d’estimer l’héritabilité, à partir d’une formule générale de décomposition de la covariance qui tient compte du degré d’apparentement entre membres des paires d’individus choisis :
φ est le coefficient de parenté, u est le coefficient de double parenté
Héritabilité au sens étroit
( − µ ) = ( − µ )
= b P h P
A ˆ
AP²
Coefficient de régression de la valeur additive, A, sur le phénotype :
Var ² Var Var
) ,
Cov( h
P A P
e D
A
b
APA + + = =
=
Or P – µ = A + D + e, d'où :
( , ) .
VarP P A
b
APCov − µ
car =
Héritabilité au sens étroit
R S
µR
µS
S = µS - µ
R = µR - µ
L'espérance de la valeur additive AS du groupe d'individus sélectionnés est :
E(AS) = h²(µS - µ)
Comme la valeur additive est la seule qui se transmette, E(AS) exprime également l'écart entre la valeur p h é n o t y p i q u e m o y e n n e d e s d e s c e n d a n t s d e s i n d i v i d u s sélectionnés, µR, et celle d'individus tirés au hasard dans la population, µ,.
L'écart ΔG = R = µR - µ, appelé progrès génétique ou réponse à la sélection est donc :
ΔG = R = h²(µS - µ)
R = h
2S
h
2= V
A/ V
P= R / S
R = h 2 S
R
Parents S
Parentssélectionnés
D esce nd an ts
La régression parent-enfant et la réponse à la sélection (une génération)
La réponse à la sélection dépend de l'importance de
la variabilité génétique héritable dans la population
Héritabilité au sens étroit
§ Part héritable de la variabilité phénotypique
§ Coefficient de régression enfant/parent-moyen
§ Paramètre qui permet de prédire la réponse à la sélection
(applications notamment en amélioration des espèces)
§ L'héritabilité n'est pas un paramètre biologique immuable attaché à un caractère. Sa valeur dépend de l'environnement et de la population. L’héritabilité décroit au cours des générations de sélection.
§ La proximité entre les termes héritabilité et hérédité entraîne des confusions.
- Un caractère héréditaire est un caractère qui est génétiquement déterminé.
- Un caractère héritable est un caractère qui, dans une population donnée, a une variance génétique non nulle, la première propriété (être héréditaire) n'entraînant pas nécessairement la seconde.
§ L'héritabilité ne nous renseigne pas sur l'origine d'une différence entre les moyennes de deux populations
Difficultés liées au concept d'héritabilité
cf. document « Héritabilité_D_de_Vienne.pdf »
A la recherche des gènes à effets quantitatifs (QTL, Quantitative Trait Loci) :
l’exploitation du déséquilibre de liaison
Relation entre la masse de la graine de haricot et sa pigmentation (Karl Sax, 1923)
30,7 ± 0,6
Masse
Couleur
P/P
P/p
p/p
Génotype
=> Un (des) facteur(s) contrôlant la masse au voisinage de chacun de ces gènes
Notion de marqueur de gène à effet quantitatif La recombinaison fait diminuer la corrélation
28,3 ± 0,3
26,4 ± 0,5
La notion de QTL (Quantitative Trait Locus)
Tout locus* dont le polymorphisme a un effet phénotypique :
§ un QTL rend compte d'une part de la variation du caractère dans la population (R2)
§ une substitution allélique modifie la valeur du caractère (a)
Allèle 1 du QTL Phénotype P1 Allèle 2 du QTL Phénotype P2
≠
* Acception large du terme : SNP, indel, CNV, etc., jusqu’à une portion de chromosome
VarP = VarG + Vare
VarQ1 + VarQ2 + VarQ3, etc.
R2 ≈ VarQi/VarP
Cartographie de QTL (Quantitative Trait Loci) :
profiter du déséquilibre de liaison entre marqueurs et QTL
M2 Q2
M2 Q2
M2 Q2 M1 Q1 M2 Q2
M2 Q2
M1 Q1
M2 Q2 M1 Q1
M1 Q1
M1 Q1
M2 Q1
M2 Q1
M2 Q2
M2 Q2
M1 Q1 M1 Q1
M1 Q1 M1 Q1
M1 Q2
Théorie du déséquilibre de liaison
cf. document « Déséquilibre de liaison_DdV.pdf » sur le site
Pour s’affranchir de la dépendance entre la fréquence des allèles et le déséquilibre de liaison, on utilise classiquement :
D’ = D/D
max(Attention, le Dmax dépend de la fréquence des allèles dans la population – cf. poly)
Ou encore :
r
2= D
2/puqv
D = f
11– pu
Déséquilibre de liaison (DL)
r = 0,01 r = 0,05 r = 0,10
Evolution du déséquilibre de liaison
au cours des générations (population infinie)
r = 0,5 (indépendance)
Génération
Même en cas d’indépendance, le DL ne s’annule pas
en une génération
D
n= (1 – r)
nD
0Segregating progeny
BC, F
2, RIL, families
QTL mapping
Populations
( population structure)
Association mapping/genetics
Genotyping ( ⇒ map) & phenotyping Genotyping & phenotyping
D = (1 – 2r)/4
(DL dans la population de gamètes issue de la F1)
D
n= (1 – r)
nD
o
Search for correlation markers-traits ⇓
A la recherche des gènes sous-tendant
la variation quantitative
Family-based QTL mapping
Population-based association studies
Nested Association Mapping (NAM) F2
RIL IRIL
Multiparent Advanced Generation InterCross (MAGIC)
BC
NIL
Buckler et al. 2009, Science Bergelson & Roux, 2010,
Nature Review Genetics
A la recherche des gènes sous-tendant la variation quantitative
Populations quelconques, ou :
GWAS : genome wide association studies
Cartographie de QTL dans des descendances issues de croisements contrôlés
§ Disposer d'une population en ségrégation (F2, BC, LR,…)
§ Pour chaque individu, déterminer
§ Son génotype (marqueurs sur l'ensemble du génome)
⇒ carte génétique
§ Sa valeur phénotypique
§ Mettre en œuvre des méthodes biométriques pour repérer
les marqueurs associés au caractère.
Distribution continue du caractère
QTL(s) proche de A Pas de QTL proche de B
Cartographie de QTL
Marqueur A
aa AA
Marqueur B
BB bb P
f
0 +
LR de souris
Cartographie fine de QTL
Successive backcross, then selfing
The lines with different sub-regions are compared to the recurrent line
Case 1 : QTL in interval 4-5
– + + –
Case 1
+ – – +
Case 2
+ – – –
– – + +
Case 3
Trait A Trait B
Case 2 : QTLs in intervals 1-3 and 6-7
Case 3 : a QTL for trait A in interval 1-3 and a QTL for trait B in interval 5-7 cM
I II III IV
1 2 3 4 5 6 7
3 1 3 2 2 1 Markers
RL
Génétique d’association
Associer le polymorphisme de séquence à la variation phénotypique
Quantitative versus qualitative variation
⇒ wild
i-wild
jvs. mutant-wild
W5 W4
W3 W2 W1
0
Trait value
Mutant
⇒ Several segregating loci vs. only one : QTL, Quantitative Trait Loci
⇒ Environmental influence vs. no or very small
influence
(Kearsey et Farquhar 1998)
0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16
0 4 8 12 16 20 24 28 32 36 40 44 48 52
R²*
Fréquence
Distribution « en L » des effets des QTL
Majorité de QTL à faible effet. Quelques QTL à fort effet.
* Le R2 mesure l’effet du QTL (part de variance phénotypique expliquée par le QTL.
176 combinaisons expérience/caractère
Déterminisme génétique de la sensibilité à la photopériode chez l'orge
Strake et Börner, 1998
Population F2 Atsel x Betzes
La sensibilité à la photopériode est gouvernée par un gène majeur et de nombreux gènes à faible effet
Que faire des QTL ?
- De la génétique : « dissection de l'architecture génétique des caractères quantitatifs »
- De la sélection assistée par marqueurs (SAM)
- De la biologie moléculaire (isolement et caractérisation des QTL) - Prise en compte pour l'évolution et la modélisation de la relation
génotype-phénotype.
C
C
E - Validation par transformation des plantes avec les ORF candidates
C - Criblage d'une banque de grands fragments (BAC); ajout de nouveaux marqueurs correspondant aux extrémités des BAC et estimation
du rapport kb/cM
B - Cartographie fine par ajout de nouveaux Marqueurs et augmentation
du nombre d'individus étudiés
A - Cartographie génétique du gène cible C avec des marqueurs moléculaires
D - Recherche des ORF dans le fragment portant 2 marqueurs encadrant C
C
Etapes du clonage positionnel
Positional cloning of fw2.2 , a QTL Controlling fruit size in tomato
Frary et al., Science, Vol. 289, Juillet 2000
Transcription factor
The role of regulatory variation in complex traits and disease
Albert and Kruglyak
NATURE REVIEWS | GENETICS 16 | 2015 | 197