• Aucun résultat trouvé

De la génétique des populations à la génétique quantitative

N/A
N/A
Protected

Academic year: 2021

Partager "De la génétique des populations à la génétique quantitative"

Copied!
75
0
0

Texte intégral

(1)

De la Génétique des Populations

à la Génétique Quantitative

Biométrie

Claire BARIL Jean-Claude BERGONZINI U.R. AnIS T Septembre 1994

CIRAD-Forêt

Département Forestier du Centre de Coopération Internationale en Recherche Agronomique pour le Développement

45 bis, avenue de la Belle-Gabrielle 94736 NOGENT-sur MARNE Cédex (FRANCE)

(2)

S O M M A I R E

Pages

1. CAS D ’UN LOCUS 2

1.1 Modèles Génétiques et Statistiques (locus biallèlique) 2 1.2 Principaux param ètres statistiques (locus biallèlique) 4

1.3 Cas d ’un locus multiallèlique 8

1.4 Im portance de la Dominance 8

2. M ODELE A PLUSIEURS LOCI 10

2.1 En l ’abscence d ’épistasie 10

2.2 E n présence d ’épistasie et d ’équilibre de liaison 10

2.3 Le déséquilibre de liaison 12

3. NOTIONS D ’A PPA R E N T E M E N T 15

3.1 Coefficient de simple parenté 15

3.2 Covariances entre apparentés (en régime panmictique) 16

4 E F F E T S DES SYSTEMES DE R EPR O D U C T IO N 20

4.1 La consanguinité 20

4.2 Hybridation entre populations 22

4.3 Effet de la panmixie 23

5. G É N O T Y P E E T PH É N O T Y PE 25

5.1 Héritabilités 25

5.2 Covariances entre caractères 26

r

6. T H É O R E M E FONDAMENTAL DE LA SÉLECTION 28

6.1 Cas d ’un locus multiallèlique (Fisher) 28

6.2 Généralisation au cas multiloci (Ewens) 31

6.3 Passage au tem ps continu 32

7. LA G ÉN É TIQ U E QUANTITATIVE 35

7.1 Modèle infinitésimal et approche Gaussienne 35

7.2 Lien avec le théorème de Fisher (Charnov 1989) 36 7.3 Généralisation aux cas d ’appariem ents préférentiels 39

8. FORMALISATION DE TURELLI E T BARTON 42

I N T R O D U C T I O N 1

ANNEXES

(3)

A u c o m m e n c e m e n t était M E N D E L ru m in a n t ses p ensées solitaires. Pu is il dit : “Q u ’il y ait des p o i s ”, et il leur dit : ’’Croissez et multipliez, différenciez-vous et asso rtissez-vo us i n d é p e n d a m m e n t ”. A i n s i firent-ils, et cela était bon. Puis advin t que M E N D E L r a s se m ­ bla ses p ois et les sépara en grain es rondes et ridées; il appela les rondes d o m ina n tes, et les ridées récessives, et cela était bon. M a is M E N D E L v it alors q u ’il y a va it 4 5 0 pois ronds et, 102 p o is ridés. Cela n ’était pas bon. C a r la loi stipule q u ’il doit y a v o ir trois ronds p o u r un ridé. E t M E N D E L se dit en lui-m êm e: “G o tt in H im mel, c ’est là l ’oeuvre d ’un e n n e m i qui aura s e m é des m a u v a is pois dans m o n j a r d i n à la f a v e u r de la n u i t ”. E t M E N D E L p r i s d ’un j u s te courroux, frappa sur la table et dit: “Eloignez-vous de m oi, pois m a u d its et diaboliques, retournez dans ces ténèbres où vous serez dévorés p a r les rats et les s o u r is ! ”Et il en f u t ainsi; il ne resta plus que 300 pois ronds et 100 pois ridés, et. cela é ta it bon.

Excellent m ê m e . E t M E N D E L le publia.

Anonyme 1972 ‘Peas on e a rth ’ Hort. Sciences N7, p.5.

(4)

The f a m i li a r M e n de lia n ratios, which display the m echan ism of inheritance, can be seen only when a g ene difference at a single locus g ives rise to a readily detectable difference in s o m e such p r o p e r ty of the organism. Q u a n tita tive differences, in so f a r as they are inherited, depend on genes whose effects are sm a ll in relation to the v a r ia tio n arising f r o m other causes. Furthermore, q uantitative differences are usually, though n o t necessarily always, influenced by gene differences at m a n y loci. Consequently the individual genes, w h eth e r f e w o r m a n y , cannot be identified by their segregation; the M end elia n ratios are n o t displayed, and the m ethods of M endelian analysis cannot be applied.

It is, nevertheless, a basic p r e m is s of quantitative g enetics that the inheritance o f quan­ tita tiv e differences depends on genes subject to the sa m e laws of tra n sm issio n and having the s a m e general pro p e rties as the genes whose tra n m issio n and pro p e rties are displayed by qualitative differences. Q u a n tita tiv e g enetics is therefore an extension of M e n d e lia n genetics, resting squarely on M en d elia n p rin cip les as its fo u n d a tio n .

The m eth o ds of stu d y in quantitative g enetics differ f r o m those em p lo yed in M en d elian g e n e tic s in two respects. In the fir s t place, since ratios cannot be observed, single p r o ­ g e n ies are u n inform ative, and the unit of stu d y m u st be extended to ‘p o p u la tio n ’, that is, larger groups of individuals comprising m a n y progenies. And, in the second place, the nature of the quantitative differences to be stu d ie d requires the m e a s u r e m e n t, and n o t j u s t the classification, of the individuals. The extension o f M e n d e lia n g e n e tic s into quantitative g e n e tic s m a y thus be m a d e in two stages, the fir s t introducing n e w concepts connected w ith the g e n e tic pro p e rties of ‘p o p u la tio n s ’and the second introducing concepts connected with the inheritance of m ea surem en ts...

These two p a r ts of the subject are often distinguished by different n a m e s, the f ir s t being referred to as ‘population g e n e t i c s ’and the second as ‘q uantitative g e n e t i c s ’o r ‘b io m etrica l ge n e tic s

‘Introduction to QUANTITATIVE G E N E T IC S ’- D. S. FALCONER, 1989

(5)

DE LA GÉNÉTIQUE DES POPULATIONS A

LA GÉNÉTIQUE QUANTITATIVE

Claire Baril avec la collaboration de Jean-Claude Bergonzini

I n t r o d u c t i o n

La théorie de la sélection intègre deux types d ’approches analytiques:

la G é n é t i q u e d e s p o p u l a t i o n s qui perm et d ’étudier des caractères déterminés par un ou deux gènes (variations discrètes),

la G é n é t i q u e Q u a n t i t a t i v e , qui utilise les approximations issues des propriétés statistiques de la loi Normale en se basant sur les trois hypothèses suivantes: * les distributions des p héno typ es et des génotypes sont Normales,

* les caractères quantitatifs continus sont gouvernés par un nombre infini de gènes à effets infinitésimaux et tous indépendants 2 à 2 (le Modèle in finitésim a l perm et d ’étendre au génotype entier les calculs exacts obtenus pour un seul gène),

* les populations de départ sont infinies (pas de dérive). Or, il est clair que ces hypothèses ne sont pas réalistes. En effet:

. Si l’on p eu t considérer que la distribution des valeurs génotypiques suit une loi Normale, ceci n ’est plus vrai sous l ’effet de la sélection (troncature).

. Les gènes sont portés par un nombre fini de chromosomes de taille finie, donc les gènes déterm inant un caractère sont en nombre fini et seul un p e tit nombre d ’entre eux peuvent être considérés comme indépendants.

. En sélection artificielle la taille des populations est de plus en plus réduite, n o ta m ­ m ent avec l ’avènement des nouvelles techniques de reproduction.

Les limites de ces deux approches étant posées, nous allons tenter de présenter les bases de la théorie de la sélection.

t

(6)

2 1 C A S D ’UN L O C U S

1

C a s d ’u n l o c u s

1.1

M o d è l e s G é n é t i q u e s e t S t a t i s t i q u e s ( lo c u s b ia llè liq u e )

Notre compréhension des mécanismes qui gouvernent l'expression et la tra n sm iss io n des caractères nous vient de la célèbre expérience que J. Mendel réalisa sur les pois (1865). Mendel disposait de pois lisses O et de pois ridés ® . Les ayant croisés, il o btint des pois lisses O qui recroisés entre eux donnèrent à nouveau des pois lisses et ridés, dans les proportions respectives de 3/4 et 1/4. Mendel fit alors trois hypothèses:

1 Au niveau individuel, le caractère est gouverné par un gène, support de l ’expression de deux facteurs (le père et la mère), chacun de ces deux facteurs pouvant prendre deux modalités: les allèles A \ et A i (plan factoriel 22).

i

2 Lorsque deux allèles différents sont présents chez un même individu, l ’un p e u t être

d o m in a n t A \ (il détermine à lui seul l’expression du caractère), l’autre récessif Ao.

3 Lors de la reproduction, un individu ne fournit qu ’un seul des deux allèles dont il est pourvu.

Ces hypothèses perm etten t d ’expliquer les résultats de Mendel à l’aide du schéma suivant:

Expression du caractère: P h é n o t y p e Transmission du caractère: G é n o t y p e 0 * 0 >--- v--- -( / M i ) x -( ¿ M 2) l ( A1A2) X ( A1A2) '---v--- ' 1 ( A i A \ ) ( A i A2) ( A2A i ) ( A2A2) 4 0 0 '---v---' 0 0 0 © R a p p e l :

Chez les individus diploïdes qui représentent la plupart des espèces cultivées, les

c h ro m o som e s sont au nombre de 2n. Ils constituent le support de l'inform ation génétique. L ’unité de transmission de cette information est le locus. A chacun des loci se situent 2 g è n e s, l ’un provenant du père et l ’autre de la mère, qui peuvent agir selon a u ta n t de modalités q u ’il existe d’allèles (formes particulières que prend chaque gène, déterm inant l ’un des états possibles du caractère codé par ce gène). Soit p et q les fréquences respectives des 2 allèles A \ e t A2 (p + q = 1) dans la population

étudiée, il existe quatre génotypes potentiels A \ A \ , A\A%, A2A1 et A2A2- On suppose

dans la suite de l ’exposé que le caractère étudié est quantifiable et que g u , g12, 521 et 522

sont les valeurs respectives associées à ces génotypes, on considère généralement q u ’il n ’y a pas d ’effet lié au sexe ( A1A2 = A2A1) et donc que g ^ = 521

(7)

-1.1 M o d e le s G é n é tiq u es et S ta tis tiq u e s (locus biallèlique) 3

Sous l ’hypothèse de H a r d y - W e i n b e r g qui postule que la fréquence d ’un génotype est le produit des fréquences de ses allèles, les fréquences respectives des trois génotypes différents sont p2, 2pq et q2.

H . W . : (p A i + q A z) 2 = p2A \ A i + 2pqAiA% + q2A2A2

Pour com parer les valeurs génotypiques et tenir compte du com portement de l’hétérozygote par rap p o rt aux homozygotes, on définit trois param ètres génétiques: la moyenne des homozygotes (c), l ’effet de dominance (d) et l’effet additif de l’allèle A \ (a).

C = ( d u + ^22) / 2 d = 9 1 2 — c a = (gn — 522)/2 = 911 - c = c - 522 d > 0 a > 0 R e m a r q u e :

On suppose le plus souvent que la dominance est positive. C ette a ttitu d e se justifie dans la mesure où les caractères sur lesquels porte la sélection sont mesurés par des variables qui prennent des valeurs d ’a u ta n t plus grandes que le caractère est mieux adapté au milieu dans lequel s’exerce la sélection.

Différents d e g r é s d e d o m in a n c e peuvent être envisagés: si d / a = 1 s i O < d / a < 1 si d / a > 1 dominance complète dominance partielle f< superdominance ij u - 4 0 g il - <5 L'~ 1 1 gu : 10 cj il - vo Q g u - S Jit =- î 3 II - i u c c e C: 9 C :°) d -- 2 cl - i « r 4 J/a - ^

4

V

0

û - ■/ k/u J

Ces degrés de dominance, fonctions de la valeur de l ’hétérozygote (g12 ) par rap p o rt aux homozygotes (gn et 522) sont représentés sur le schéma suivant (Demarly, 1977):

9 22 9 n + 922 911 Super-dom. î Dominance complète Dominance partielle î Additivité parfaite 912 Dominance partielle

T

Dominance complète Super-dom.

Le modèle proposé par Mendel m et en relation la valeur génétique d ’un individu avec deux facteurs (père i et mère j ) à deux modalités (1 < i < 2 et 1 < j < 2). On suppose que les deux facteurs sont identiques.

(8)

4 1 C AS D ’UN LO CUS

9ij — f¿ + &i + GCj + Pij

H = Valeur moyenne de la population

a i = Effet additif de l ’allèle i,

, ,, . .. A\ —► a i

= avantage moyen pour un genotype d avoir 1 alleie <

I A2 —» Û2

Pij . = Effet de dominance — écart aux valeurs additives = interaction entre les allèles i et j ,

= effet spécifique du couple d ’allèles.

A i A i A 1 A 2 ^2 ^ 2 2a i + p u a l + a 2 + P l i 2 a 2 + P2 2 v1 2 pq Si l ’o n p r e n d u n in d iv id u a u h a s a r d d a n s la p o p u l a t i o n , s a v a l e u r g é n o t y p i q u e e s t u n e v a r ia b le a l é a t o i r e G q u i p e u t p r e n d r e les d iff é r e n te s v a le u r s s u iv a n te s : 011 = A4 + 2c*i + P u 012 = A4 + a l + « 2 + Pl2 022 = A4 "1“ 20^2 + @ 2 2

De m anière plus générale, la valeur génétique s’écrit: G = f i + A - \ - D où A synthétise la p artie additive (a i, 0:2) et D , les interactions entre allèles homologues (fin, P1 2, @2 2

)-1.2

P r i n c i p a u x p a r a m è t r e s s t a t i s t i q u e s ( lo c u s b ia llè liq u e )

Considérons la population de distribution génique p A \ -f 9A2

et de distribution génotypique p2A \ A i + 2p q A \ A2 + q2 A2A2

sa valeur moyenne s’écrit: n — p 2g n + 2p9 9i2 + Ç2022 = c + 2pqd -f (pq)a

et sa variance: ctq = 2pq[ad(pq) ] 2 -t- 4p2q2d 2.

Ces valeurs sont aussi l’espérance et la variance de la variable G introduite ci-dessus.

Soit a i la moyenne pondérée des génotypes ayant l ’allèle A i, les valeurs additives s’écrivent: a 1 = P011 + 9012 - fi = q[a - d(p - ç)]

« 2 = P9i2 + 9022 — ¡I —- p [ a - d(p - q)] avec a i p + 0 2 9 = 0

Les valeurs de dominance s’écrivent:

P l i = 011 - M - 2 a i = - 2q2d P1 2 = 012 - M - “ i - a 2 = 2pqd

(9)

1.2 P r in c ip a u x p a r a m è t r e s s ta tis tiq u e s (locus biallèlique) 5

P22 = 522 - /W - 2 a2 = —2p2d avec p p n + qP1 2 = p P n + qp22 = 0

On p e u t alors décomposer la variance génétique totale Oq de la manière suivante:

aG = ° A + °D

° a = Pa ï + 9« 2 = 2pq\a - d(p - q)? ° D = P2PÏi + 2 P<lPi2 + ^ P 2.2 = 4 p 2q2d 2

ce qui signifie que les variables A et D introduites précédemment sont indépendantes. R e m a r q u e :

On a exprimé les différentes variances en fonction des param ètres d e t a qui ne dépendent pas des pondérations retenues pour calculer la décomposition des gtj ,

ce qui facilite l’interprétation.

Les deux séries de figures qui suivent illustrent l’im portance relative des variances d ’additivité (notée V ( A ) ) et de dominance (notée V ( D ) ) en fonction d ’une p a rt de la fréquence de l ’allèle dom inant A\ (notée p), et d ’autre part du degré de dominance (noté d / a ) .

La valeur de a a été arbitrairem ent fixée à 1.

* La première série de figures représente V ( A ) , V(D) et V ( G ) — V(.A) + V ( D ) dans les cas de dominance partielle (d / a = 0.5), de dominance complète ( d / a = 1) et de superdominance ( d / a = 1.5). On constate dans tous les cas la prépondérance de la variance d ’additivité pour les faibles fréquences de l ’allèle dominant favorable

A\ . Par ailleurs, on observe une remontée progressive de la variance de dominance avec l ’augm entation du rap p o rt d/ a.

* La seconde série desfigures représente V ( A ) , V ( D ) et V ( G ) dans trois conditions de fréquences alléliques: ( p, q) = (0.25, 0.75), (p, q) = (0.5, 0.5) et ( p, q) = (0.75,0.25). Les résultats obtenus viennent confirmer les observations faites à p artir de la pre­ mière série de figures. On vérifie que lorsque p = ç, la variance d ’additivité ne dépend pas du degré de dominance (F (A ) = V ( D ) pour d / a = 2). De plus, tandis que la variance de dominance augmente systém atiquem ent avec le degré de domi­ nance, la variance d ’additivité décroît avec l ’augm entation du degré de dominance lorsque p > q (V(A) = V ( D ) pour d / a = 1 puis V ( A ) < V ( D ) quand d / a > 1). Enfin, la variance génétique totale V (G) est d ’au tan t plus élevée que l ’allèle récessif défavorable A2 est prépondérant.

y - Vl - C

(10)

6 Importance relative des variances d'additivité

et de dominance dans le cas biallelique en fonction de p

P

À

P

(11)

Importance relative des variances d'additivité

et de dominance dans le cas biallelique en fonction de d/a

7

d/a

f d/a

d/a

= 0.75

(12)

8 1 C A S D ’UN LO CUS

1.3

C a s d ’u n lo c u s m u lt ia l lè l iq u e

Le modèle se généralise facilement dans le cas où plus de deux allèles coexistent à un même locus. Soit les allèles Ai, A?,..., Ai,..., Ak de fréquences J>i,p2,•••, Pi,---, Pk-

La formulation de la valeur associée au génotype A iA j est inchangée:

9ij = M + a i + aj + Pij

k k k k

avec Y^PiOii = Y^PjOtj = PjPü = 0

i — 1 j=1 i — 1 j=1

Pour un individu pris au hasard dans la population, on a : G — ¡j, -\- A -t- D

avec E ( A ) = E ( D ) = 0

= 2 et cov(A, D) — 0

= J^PiPjPtj = J ^ P iP jtfj - 2 Y , P i a i

i j i j i

La variance génétique s ’écrit:

° G = ° A + a D = 2 + Y s P i P ô P l

\ i / i,j

Dans le cas multiallèlique, la notion de dominance existe toujours. En particulier, on p eu t l’examiner pour chaque couple d ’allèles ; il est également possible q u ’un allèle soit dom inant p ar rap p o rt à tous les autres.

1.4

I m p o r t a n c e d e la D o m i n a n c e e n s é l e c t i o n

La dominance et la superdominance constituent les deux hypothèses qui ont été for­ mulées pour expliquer le phénomène à'hétéro sis, essentiellement présent chez les espèces allogames. Il s’agit de l ’augm entation de vigueur engendrée par le croisement entre in­ dividus non apparentés. A l ’inverse, on observe une dépression due à la consanguinité après reproduction entre individus apparentés.

. H y p o t h è s e d e la d o m in a n c e ( c o m p lè te o u p a r t i e l l e ) : Pour un caractère quantitatif, l ’hétérosis serait dû à la réunion dans un même génotype d ’un grand nom bre d ’allèles dominants. On suppose implicitement que la dominance est favor­ able (d > 0), ce qui va dans le sens de la sélection naturelle. L ’allogamie autorise l’accumulation d ’allèles récessifs défavorables à faible fréquence à de nombreux loci: c’est le fardeau génétique. En effet, les allèles récessifs défavorables sont masqués à l ’é ta t hétérozygote. L ’autofécondation fait alors apparaître ces gènes à l ’état homozygote, d ’où l ’effet dépressif de la consanguinité. En fait, les homozygotes

(13)

1.4 Importance de la Dominance en sélection 9

construits avec des allèles récessifs défavorables m etten t en évidence le fardeau génétique et les homozygotes construits avec des allèles dominants favorables per­ m e tte n t de fixer l ’hétérosis. Sous l’hypothèse de dominance complète, la fix a tio n d e l ’h é t é r o s i s à long term e est envisageable, ce qui influe naturellem ent sur le choix d ’une stratégie de sélection (lignées ou hybrides).

. H y p o t h è s e d e la s u p e r d o m i n a n c e : La supériorité de l ’hybride par rap p o rt aux parents viendrait de la supériorité de l ’é ta t hétérozygote à certains loci. C ’est la combinaison de deux gènes à l’é ta t hétérozygote qui entraînerait une p o ten ­ tialité supérieure à celle des homozygotes. En fait, la superdominance apparaît souvent comme un phénomène marginal: on parle de superdominance marginale. L ’hétérozygote présente un comportement plus stable sur l’ensemble des milieux ou sur l ’ensemble de la vie d ’une plante, sans jam ais avoir été avantagé dans des conditions précises. La superdominance est alors la conséquence de l’accumulation de simple dominance dans différents milieux. Par ailleurs, la superdominance au niveau d ’un caractère complexe p eu t être le résultat de gènes à effets pléïotropiques (la pléïotropie est l ’action simultanée d ’un gène sur plusieurs caractères). Sous l’hypothèse de superdominance: l ’h é té r o s i s e s t in fix a b le , et par conséquent les variétés hybrides resteront toujours justifiées. Par ailleurs, la multiplication végé­ tative ou la multiplication par apomixie (développement d ’une graine sans fécon­ dation) p e rm e ttra de reproduire à l ’identique les meilleures combinaisons hétérozy­ gotes par voie non sexuée (variétés clones).

R e m a r q u e :

Avec l ’hypothèse de dominance, lorsque le caractère sélectionné est gouverné par un grand nombre de loci, l ’hétérosis est aussi infixable à l’échelle du sélectionneur.

En conclusion, la r e l a t i o n e n t r e la d o m i n a n c e e t le s y s tè m e d e r e p r o d u c t i o n e st i m m é d i a t e . L ’allogamie p erm ettan t le développement du fardeau génétique, la fraction d ’hétérosis fixable p eu t être im portante pour ce système de reproduction. A l ’inverse, le fardeau génétique étan t quasiment inexistant chez les espèces autogames (les allèles récessifs défavorables ont été éliminés ou n ’ont pas pu se développer sous l’action de la sélection naturelle), ces dernières sont moins sujettes à la dépression de consanguinité, ce qui n ’exclut pas l’hétérosis dû à la superdominance. La seule possibilité de fixer la superdom inance réside dans la duplication du génome diploïde: c’est Y allopolyploïdie. Le blé, avec ses trois génomes élémentaires juxtaposés, est un représentant typique de ce processus (le non-appariem ent à la méiose des génomes répétés confère un com portem ent diploïde aux espèces allopolyploïdes , contrairement aux espèces autopolyploïdes).

(14)

10 2 M O D E L E A P L U S IE U R S LO CI

2

M o d è l e à p l u s i e u r s lo c i

2.1

E n l ’a b s e n c e d ’é p i s t a s i e

En l'absence d ’épistasie (c’est-à-dire en l ’absence d ’interaction entre gènes non hom o­ logues), la généralisation du modèle précédent au cas d ’un caractère q u an titatif contrôlé par plusieurs loci indépendants du point de vue de leur action ne présente aucune dif­ ficulté. Il suffit simplement de tenir compte de l ’additivité des effets des gènes aux différents loci, ce qui se tra d u it dans les formules par une sommation supplém entaire p o rta n t sur l’indice n (identificateur des loci):

° G = °A + °D avec ° A = 2 5Z ( S Pi,n®ln ) et o \ = ^ Pi,nPj,nPij¡n

n \ i / y \ ij )

2.2

E n p r é s e n c e d ’é p i s t a s i e e t d ’é q u ilib r e d e lia is o n

En présence d ’épistasie (c’est-à-dire en présence d ’interaction entre gènes non hom o­ logues) et à' équilibre de liaison (association au hasard des loci dans la population, notion distincte de celle de linkage), la définition des effets procède de la même démarche. Considérons le c a s d e d e u x loci (n=2):

Il est alors possible de définir des interactions (cf. ci-dessous) entre deux gènes non homologues (épistasie additive x additive , notée AA), entre deux gènes homologues et un non homologue (épistasie additive

x

dominance, notée AD) et entre deux gènes homologues et deux autres gènes homologues (épistasie dominance x dominance, notée DD). C x C2 Cl C2 Ci C2 Cl c2 locus 1

Q]

[T

i j i j I 1 x locus 2

|_kj

[jj k ♦— > 1 k 1 k 1 A D AA AA Ci C2 C?!

c 2

Cl

c 2

locus 1 i j lil j i j /

\

locus 2 j k 1 1 k 1 k 1 AD AD DD

(15)

2.2 En présence d ’épistasie et d ’équilibre de liaison 11

Le modèle de décomposition de la valeur génotypique s’écrit:

9ijkl — M "f" a i + a j + a k + &i (A)

+ P i j + Pki (D)

+ (£*oO¿fc + (&®)il + (a a )jk + (a a )jl (A A)

+ (a P)ikl. + (&P)jkl + (a P)kij + (Otf3)iij ( A D )

H P P h k i (D D ) ,

épistasie

= g....

oci = 9i... - M =“ / ,PjPkPl9ijkl M j,k,l PkPl9ijkl t1 p i j = 9 ij.. - /i -- a i — a j = a i a j (cxOi)ik k,l 9i.k. — M - a i aiç

(cX-P)ijk = 9ijk. - fi -i p 1 P Vo. 1 &k Pij (&&)ik ( a a ) j k

On peut, p ar ailleurs vérifier que:

ZpiCKr = ^ P i P j P i j = Y 2 P i P k ( ^ ) i k = ^ P i P j P k i ^ i j k = ^2PiPjPkPl(PP)ijkl = 0

i ij ik ijk ijkl

Du point de vue de l ’analyse de variance, on est en présence d ’un caractère déterminé par 4 facteurs (père et mère s’exprim ant à deux loci différents) et les (¡3), (a a ) , (&P) et

( PP) reflètent respectivement les interactions de 1er, 1er, 2e7ne et 3eTrw ordre.

Si l ’on choisit un individu au hasard dans la population, la variable aléatoire qui mesure sa valeur génotypique s ’écrit donc:

G = ¡ i - \ - A - \ - D - \ - A A + A D -1- D D

r ________ L_________________ !____________________________

A: variable aléatoire qui prend pour valeur les a i + a j + a k + a i (valeur génétique additive), D: variable aléatoire qui prend pour valeur les pij + Pki (valeur génétique de dominance), AA: variable aléatoire qui prend pour valeur les ( a a ) i k + ( a a ) j i + (cm)jk + (ota)ji (valeur génétique additive x additive),

AD: variable aléatoire qui prend pour valeur les (aP)iki + (a P)jki + (&P)kij + (&P)uj

(valeur génétique additive x dominance),

DD: variable aléatoire qui prend pour valeur les (PP)ijki (valeur génétique dominance x

dom inance). On a:

E ( A ) = E ( D ) = E ( ( A A ) ) = E ( ( A D ) ) = E ( ( D D ) ) = 0 Une variance est définie pour chaque type d ’effet:

a AA = ({ A A )2)

(16)

12 2 M O D E L E A P L U S IE U R S LOCI

a DD ~ E ({D D )2)

L ’hypothèse d ’équilibre de liaison p e rm e tta n t d ’annuler les covariances entre loci, la variance génétique totale s ’écrit:

° G = a A + ° D + a A A + a A D + ° D D

On notera I la somme des phénomènes d ’épistasie (A A), (A D ) et (DD).

L’extension du modèle à un nombre supérieur à deux loci ne pose pas de problème autre que celui d ’interpréter les nombreux param ètres qui en découlent (interactions géniques d ’ordre supérieur à deux AAA, AAD, ADD, DDD,...).

2 .3

Le d é s é q u ili b r e d e lia iso n

En ne considérant que deux loci, le déséquilibre de liaison tra d u it l ’écart entre la fréquence de chaque type de gamète et l ’espérance de cette fréquence si les gènes étaient associés au hasard.

Le schéma ci-dessous figure la transmission et la recombinaison des allèles:

Gamète m aternel Gamète paternel

Gène A Ai Ak Gène B B j Bi 4 Méiose 4 Gamète transm is Gamète transm is Gamète reconstitué G amète reconstitué Gène A A t ou Ak ou Ai ou Ak Gène B Bj Bi Bi B j Reproduction des associations parentales

Recom iinaison des associations parentales

Si les deux loci sont indépendants, les quatre types de gamètes seront équiprobables, par contre s’il n ’y a pas d ’indépendance, la transmission aura tendance à favoriser les associations parentales.

Désignons par c la proportion de recombinaisons:

si c = 0 —> il n ’y a pas de recombinaison (linkage total=liaison physique des loci sur le gamète),

si c = 1 /2 —» il y a a u ta n t de recombinaisons que de reproductions des associations parentales (loci indépendants).

(17)

2.3 Le déséquilibre de liaison 13

Notons Pa b la fréquence d ’une combinaison A B dans la population parentale et P'AB la fréquence de cette même combinaison à la génération suivante, on a:

Pa b = p a b( 1 - c) + cpAjpB

pa et p s sont les fréquences des allèles A et B. A = P a b — V a P b est le Déséquilibre de liaison.

Dans le cas biallèlique, notons par l’indice 1 les allèles favorables aux deux loci (A \ et B i) et par l ’indice 2 les allèles défavorables (A i et B<i). On pourra écrire:

^ P A\B\ VA\VB\ PA2B2 P A2P B2 (L‘a\B2 PA1PB2) Í p A2Bi PA2PB1)

Pa\B\ PA2B2 PA\B2PA2B1

Le signe de A est arbitraire. Par convention:

A > 0 lorsqu’il y a excès de gamètes p o rtan t des allèles favorables (couplage), < A < 0 lorsqu’il y a excès de gamètes p o rta n t des allèles défavorables (répulsion),

A = 0 dans la situation d ’équilibre.

Il serait plus juste de parler de déséquilibre gamétique ou de déséquilibre d ’association puisque la liaison physique n ’intervient pas. Ce déséquilibre est souvent le reflet d ’un phénomène de coadaptation génique (arrangement particulier d ’allèles dont la transm is­ sion groupée confère un avantage sélectif).

Lorsqu’il y a équilibre de liaison la covariance entre les effets des allèles à deux loci différents d ’un même gamète est nulle.

Pour mieux visualiser l ’im p a c t de la s éle c tio n sur l ’équilibre de liaison, on consid­ ère un caractère Y déterm iné par la somme de deux variables X \ et X2 indépendantes.

La distribution de Y est,dans l’exemple schématisée par un cercle, les valeurs de Y sont constantes sur une parallèle à la deuxième bissectrice.

Schématiquement, trois types de sélection peuvent tronquer la distribution de Y :

Y > a c o v ( X i , X2) < 0 a < Y < b cov(Xi, X2) < 0 Y < a e t Y > b cov(Xi, X2) > 0

(18)

14 2 M O D E L E A P L U S IE U R S LOCI

En considérant les X comme les effets additifs des gènes sur le caractère, et sachant l ’équivalence entre covariance et déséquilibre de liaison dans le cas additif, on constate q u ’une sélection directionnelle ou pour un optimum générera des A < 0, tandis q u ’une sélection disruptive générera des A > 0 entre gènes à des loci différents.

A u t r e s f a c t e u r s a f f e c ta n t l ’é q u ilib r e d e liaison:

- le système de reproduction: par accouplements non-aléatoires ou stru ctu ratio n des populations,

- la dérive: l ’échantillonnage entraîne des variations aléatoires de la valeur de A,

- les phénomènes d ’entraînement ( “auto-stop” = “hitch-hiking” ): ils concernent les vari­ ations de fréquence en un locus, neutre ou sélectionné, en fonction de son déséquilibre de liaison avec un locus sélectionné (A initial doit être ^ 0),

- le nombre de loci: on m et en évidence des déséquilibres de liaiso^ d ’a u ta n t plus im por­ ta n ts que le nombre de loci pris en compte dans le modèle est élevé.

R e m a r q u e :

La liaison génétique en elle-même n ’engendre pas de déséquilibre de liaison. Si un déséquilibre A y existe ou est créé à la génération (t) entre deux loci i et j , sa relaxation à la génération suivante en l’absence des facteurs l’ayant généré sera d ’a u ta n t plus lente que le tau x de recombinaison Cÿ entre ces loci sera plus faible:

(19)

15

3

N o t i o n s d ’a p p a r e n t e m e n t

I d e n t it é d es gènes: Deux gènes sont identiques s’ils dérivent sans m utation (par de­ scendance) d ’un même gène ancêtre.

On appelle coefficient d ’identité la probabilité pour qu ’à un locus les deux allèles soient identiques par descendance. Lorsque cette probabilité est définie pour un seul individu, il s’agit du coefficient de consanguinité, lorsqu’elle est définie pour deux individus, on parle de coefficient de simple parenté.

Le schéma suivant figure différentes relations d ’identité à p artir du croisement de deux individus non apparentés ((1) et (2)):

Deux individus hétérozygotes:

(a,b) x (c,d) on considère un locus à 4 allèles:

a, b, c, et d.

(

1

)

(

2

)

I

l ere génération:

(b,c) x (b,d) (a,c) (a,d) les individus (3) et (4) possèdent un allèle identique par descendance ( coefficient de parenté)

(3) (4) (5) (6) contrairement aux individus (3) et (6).

i

2eme génération:

(b,b) (b)d) (c,b) (c,d) l ’individu (7) possède deux allèles identiques par descendance ( coefficient de consanguinité) (7) (8) (t)) (10) contrairement à l ’individu (8).

3.1

C o e f f ic ie n t d e s i m p l e p a r e n t é

Le calcul du coefficient de simple parenté ipA fait intervenir la généalogie des deux indi­ vidus et le coefficient de consanguinité de leur(s) ancêtre(s) commun(s).

Supposons que X et Y n ’aient q u ’un ancêtre commun : Z. Un gène pris au hasard chez X ne p e u t être identique à un gène pris au hasard chez Y que s ’ils sont tous deux: - soit la réplique du même gène de l ’ancêtre commun Z,

- soit la réplique des deux gènes de Z, ceux-ci étan t identiques en raison de la consan­ guinité de Z (Fz éta n t le coefficient de consanguinité de Z).

(20)

16 3 N O T I O N S D ’A P P A R E N T E M E N T

- G ) ■ g

- ( 1 - Fz ) + Fz

/ 1 \ n + p + l

= (5) (l + F . )

S’il y a plusieurs ancêtres i communs sans lien de parenté entre eux:

/ 1 \ rxi+Pi+\

¥>a = Y 1 ( 2) Í1 + F ^)

On suppose généralement que les ancêtres communs sont non-consanguins et non-apparentés entre eux.

À

nple les coefficients de simple parenté

1 ~ 4 1 ~ 4 1 “ 8 J_ ~~ 16 J_ “ 16

( e n r é g i m e p a n m i c t i q u e )

Grâce à la définition par Malécot (1948) du concept d ’identité entre gènes, on p eu t écrire la covariance entre deux individus X et Y ayant un degré de parenté donné en fonction de deux paramètres: le coefficient de simple parenté et le coefficient de double parenté. Dans une population panm ictique d ’effectif limité, la probabilité pour que deux allèles portés p ar deux individus différents dérivent par réplication d ’un même ancêtre commun définit le coefficient simple de parenté La probabilité de tirer, dans une famille d ’apparentés, un individu p o rtan t deux allèles identiques à ceux d ’un au tre individu de la même famille définit le coefficient de double parenté (pp.

Soit deux individus X et Yr non consanguins et entre lesquels il existe un lien de parenté. On note:

a fa m et a'fa'm leurs génotypes, la fréquence de et a¿ son effet moyen, les indices f et m indiquant respectivement l ’origine m aternelle et paternelle des allèles, les valeurs génotypiques G et G' de X et F s’écrivent:

Sous cette hypoyhèse, on pourra calculer par exeri suivants: / ] \ Parent-enfant <PA — Í — J Y \ 1+1 + 1 / j \ 1+1 + 1 Pleins-frères ipA = Demi-frères <Pa = 2+2+1 /1 x 2+2+1 fx i + i + i 2 j . . / i v + '+1 /1 Cousms-germams ipA — ( — I + I -/ I V 1+2+1 Demi-oncle-neveu iça — ( — )

3.2

C o v a r ia n c e s e n t r e a p p a r e n t é s

(21)

3.2 Covariances entre apparentés (en régime panmictique)

G/i -f- A f -f- A m D et G1¡i-f- A'j + A'm+ D' La covariance génétique entre ces deux individus apparentés s’écrit: cov(G, G') = cov(Af, A'f ) + cov(Af) A'm) + cov(Am, A'f ) + cov(Am) A'm)

+ co v(A f, D') + cov(Am, D ) + cov(D, A'f) + cov(D, A'm) + c o v ( D, D')

* Calcul des termes du type E ( A x A y) avec x — f ou m et y = f ou m. E ( A x A y) — E ( A x A y/ a x — ûy).P(dx = dy) -f- E ( A x A y /a x ^ üy).P(cix ^ ay)

Oa; = ay signifie que ax et ay sont identiques par descendance. E ( A x A y) = ] T p ¿ a ¿ P ( a x = ay) + J2PiPja ia j P (ax í ay)

i i ^ j

'¿Tpipj a ia j = 0 et ^ v a r ( A f + A m) = ^ a \

ijtj *

d ’où:

cov(Af, A ’f) + cov(Af, A'm) + cov(Am, A'f ) + cov(AmA'm)

= ~^~[4<Pa\ — avec le coefficient de simple parenté de X et F.

* Calcul des termes du type E ( A xD yz) avec ax = ay ou ax = az . E ( A xD yz) — Y ^ c t ldijpipj P ( a x = a.y) -(- ^ ^OiidjjPiPjP(&x — oz )

i] avec YsVidijViPj = v y ^ P jd jj ij = 0 * Calcul de E ( D , mD'M ) avec ^ “/

J

ou

E ( D f mD'f m ) = Y lP i P i t í j \p (af = a /> °™ - am) + ^ (0/ = a ^ , a m = a}) v

a DTD avec if£> le coefficient de double parenté de X et y . donc:

(22)

18 3 N O T I O N S D ’A P P A R E N T E M E N T

La figure ci-dessous illustre les parentés demi-frères et pleins-frères (Gallais, 1990).

D

(1) D em i-frères (2) Pleins-frères

F ig u r e 2 .1 9 : I l l u s t r a t i o n d e s p a r e n t é s d e m i - f r i r e s e t p l e i n s - f r i r e s . A u lo c o s considéré a et a' représentent les gènes venant de A (» on j

)

et è et V les gènes venant de B ( h on /); ponr les demi-frères * et f sont 2 gènes quelconques issus d ’individus non apparentés à A. Pour les demi-frères <pA( H S ) = (Prob. de tirer a et o') x [Prob. (o = o ') sachant que a et a' ont été tirés]. Or, Prob. (o = a ' ) / a , a ' = Prob. de tirer 2 gènes identiques dans A; c ’est le coefficient de parenté d ’un individu avec lui-m èm e. D ’où Va( H S ) = J .

Estim ation de la covariance parent-enfant P - 0 (en anglais:Parent-Offspring). La panmixie perm et d ’écrire : /xp a r e n t = Me n f a n t = H

C O V ( P O ) = E [ ( G p a r e n t Aí)(Cen/ant ¿O] = 2 ^ ^

Estim ation de la covariance demi-frères HS (en anglais: Half-Sib). Soit i(pa) et j(p a) deux enfants demi-frères d ’un même parent pa:

(23)

3.2 Covariances entre apparentés (en régime panmictique) 19

Quelques exemples de covariances entre apparentés déduites des coefficients de simple et de double parenté sont présentés dans le tableau ci-dessous :

Parenté Va <Pd c o v ( X , Y ) Parent-enfant (PO) 1 4 0 1 2 2 Pleins-frères (F S ) 1 4 1 4 1 2 1 2 2 ° a + 4 a n Demi-frères (H S ) 1 8 0 1 2 T ° A 4 Cousins-germains 1 16 0 1 2 8 A Demi-oncle-neveu(.fir£/./V*) 1 Î6 0 1 2 8 aA

1 individu avec lui-même -(**)

. 2 ' ' 1 a A + ° D

* en anglais: Half-Uncle-Nephew.

(**) Le coefficient de simple parenté d ’un individu avec lui-même n ’est égal à 1 que si cet individu est homozygote.

La connaissance de certaines covariances entre apparentés p erm ettra ainsi de déduire les variances d ’additivité et de dominance et donc la variance génétique totale.

Dans le cas de prédiction linéaire, estimer la covariance entre apparentés p e rm e ttra de prévoir la valeur des descendants d ’une plante.

(24)

20

4 E F F E T S DES S Y S T È M E S DE R E P R O D U C T I O N

4

E ff e t s d e s s y s t è m e s d e r e p r o d u c t i o n

Au cours de la sélection, les systèmes de reproduction vont agir sur la stru ctu re géno­ typique de la population. Nous allons étudier l ’im pact des différents systèmes de repro­ duction sur la moyenne de la population.

Le tableau suivant récapitule les t a u x d ’allogam ie (pourcentages de fécondations croisées) des principales espèces étudiées au CIRAD.

Cacaoyer de 75% à 95%

Caféier . arabica ~ 10%

. robusta > 95%

Cocotier . grand ouest africain de 70% à 100%

. nain de 0% à 60%

Coton \ lorsque le niveau d ’insecticide dépend également des densités

de 7% à 35%

Eucalyptus . mesure sur graine de 70% à 90%

. stade jeune plant ~ 90%

Hévéa de 75% à 95%

Palm ier à huile > 95%

Riz dépend des conditions de culture de 2% à 10%

Sorgho de 6% à 70%

R em a rq u e :

Tandis que le taux d ’autofécondation chez les arbres entomogames (fécondation par les insectes) avoisine 10%, il n ’est plus que de 5% chez les arbres anémogames

(fécondation par le vent) tels que les gymnospermes (pins).

4 .1

L a c o n s a n g u i n i t é

L ’autofécondation perm et de diminuer le taux d ’hétérozygotie à chaque génération puisque par autofécondation les homozygotes donnent des homozygotes et les hétérozygotes don­ nent seulement 50% d ’hétérozygotes. Ainsi, sous l’hypothèse d ’indépendance des loci, à chaque génération d ’autofécondation le taux d ’hétérozygotie est divisé par 2.

Considérons une population panmictique, c’est-à-dire où il n ’existe pas d ’individus con­ sanguins. Sa valeur moyenne est égale à /x, qui est la moyenne entre la population homozygote de moyenne f i i et la population hétérozygote.

m = E P i P j d i j Z i &P i Pj g i j Ei Pi dü i j

ml = 'y .Pida

i

Si la population est infinie et s’il y a panmixie, on retrouve à la génération suivante une population identique, mais si par autofécondation ou par croisements dirigés on constitue

(25)

4.1 La consanguinité 21

dans une proportion F une sous-population d ’individus consanguins (donc homozygotes et de valeur moyenne /i¿), on obtient une population consanguine de moyenne fip:

H F = (1 - F ) f i + F ( x L = n + F (h l - f i )

F est le coefficient de consanguinité de la population.

(fil — y) — D o est la dépression de consanguinité maximale. En l ’absence d ’épistasie, l ’expression de la valeur de f i p est vérifiée quel que soit le nombre de loci concernés. Le modèle de décomposition de la valeur génotypique des homozygotes s ’écrit: 9a — fi 2o¡í -)- Pu

gn est la valeur prise par la variable aléatoire G = n + A + Do

Dq é ta n t l’interaction entre allèles homologues (dominance) restreinte aux Pu ( E ( D o) = d0 i 0)

Donc la moyenne f i i s ’écrit:

VL = J2pÏ9u

=

fi + E M *

(avec

E(A) =

E ? « ûi = °)

i i i

d ’où: fip = fi + F . E ( Dq)

Pour un ensemble de loci, en l ’absence d ’épistasie, il suffit de réaliser une sommation p o rta n t sur l’indice n (identificateur des loci):

fip - fi + F Y ï,E (D o ) = fi + F. do

n n

On retrouve bien fip — fil lorsque F = 1.

Ainsi, en l’absence d ’épistasie et pour une valeur de F donnée, la consanguinité entraînera toujours une dépression de consanguinité, quel que soit le degré de dominance, si celle-ci est favorable (d > 0), comme l ’indique la figure suivante (Gallais, 1990).

f

G e n e r a t i o n s d ’a u t o f é c o n d a t i o n

F ig u r e 2 .2 1 : E ffe t a t t e n d u de t ’a v t o f é c o n d a t i o n »ur la v i g u e u r d ’u n e p o p u l a t i o n . (en l ’absence d ’épistasie et sans sélection) ; fi : m oyenne de U population panm ictique; HL : m oyenne de la population à l ’é ta t h om ozygote; D 0 : dépression m axim ale de consanguinité.

(26)

22 4 E F F E T S D ES S Y S T È M E S DE R E P R O D U C T I O N

4 .2

H y b r i d a t i o n e n t r e p o p u l a t i o n s

On considère deux populations bialléliques Pi et P2, dont les fréquences respectives pour les deux allèles sont p 1; q i et p2> 92

-Soit Fi, la population constituée par les descendants du croisement entre les deux p op­ ulations Pi et P2) en utilisant les param ètres du modèle génétique, on p eu t écrire:

Pi ?2 Al A 2 x ¿ 1 A 2 p 1 9i P2 92 A y A i AiA 2 l A 2Ai A2A2 P1P2 P192 P2Q\ 9i92

donc p Fi = pip29n + (p i92 + P29i)si2 + 9192522 avec g n = a + c g 22 = c — a gi 2 = d + c

A»Fi = P 1 P 2 O * + c ) + ( p i ? 2 + P29i ) ( ¿ + c ) + ç i ? 2 ( c - a )

= c(pip2 + 9l92 + Pl92 + P2Q1) + a(PlP2 - Q1Q2) + d(piq2 + P2Q1)

s--- v--- /

1

= c + a(pip2 - qiq2) + d{p2qi + q2Pi)

On pose p2 = Pi + V et Pi = P ■

(iFl = c + a[(p - q) + y] + d[2pq - y{p - 9)]

Sachant que la valeur moyenne de to u te population s’écrit: // = c + 2pqd -f (p — q)a la moyenne des deux populations parentales s’écrit:

2(ma + mp2) = c + «[(p - ?) + y) + rf[2p9 - y(p - 9) - y 2}

L’hétérosis entre ces deux populations est mesuré par l’écart entre la /tpj et la moyenne des deux populations parentales (Falconer, 1961):

MF, -

2

(ma + mf2) = y 2d

On constate que l ’hétérosis dépend de la dominance et du carré de la différence des fréquences alléliques, y 2 qui mesure la distance génétique entre les deux populations. Lorsque le croisement concerne deux lignées,

y = 1 et d = Y ^ d n pour N loci indépendants.

n

(27)

4.3 Effet de 1a panmixie 23

avec p i. et p 2i les fréquences respectives de l ’allèle i dans la population 1 et dans la population 2.

On voit q u ’il p eu t exister de l ’hétérosis entre deux populations sans q u ’il y ait consan­ guinité, ainsi l ’hétérosis n ’est plus le corollaire de la dépression de consanguinité.

4 .3

E ffet d e la p a n m i x i e

La succession de plusieurs générations d ’intercroisement dans une population aura pour effet d ’accumuler le nombre de méioses et donc de recombinaisons (crossing-over). La panmixie étan t un régime de reproduction où les gamètes mâles et femelles se rencon­ tren t de manière totalem ent aléatoire vis-à-vis du ou des loci considérés, une population panm ictique ten d ra vers V équilibre de liaison.

Le schéma suivant représente (selon Bulmer) les effets de la recombinaison à p artir du croisement de deux génotypes A i A i B \ B i et A2A2B2B2 (deux loci bialléliques). Le

gamète A i B x p eu t reproduire une association gamétique de la génération précédente ou bien résulter d ’une recombinaison.

Chromosome paternel Chromosome m aternel Cellule diploïde avant la méiose Gamètes haploïdes recombinés

Les flèches verticales indiquent les emplacements des crossing-over.

Soit c la probabilité de recombinaison entre deux gamètes, pA la probabilité qu ’un gamète porte l ’allèle A \ et p s la probabilité q u ’il porte l ’allèle B1, on retrouve la fréquence PABm des gamètes A \ B \ à la génération m qui s ’écrit:

P ( A B ) m = (1 - é)PABm -\ + c p aPb

La probabilité Gm de tirer chez un individu, à la génération de panmixie m, deux allèles non homologues issus d ’une même association gamétique ancêtre, est le coefficient de lien entre ces deux allèles (G est analogue au coefficient de consanguinité F):

(28)

24 4 E F F E T S D ES S Y S T È M E S DE R E P R O D U C T I O N

R em arq ue:

Alors que les coefficients d ’identité concernent les allèles homologues (à un locus), le coefficient de lien concerne des allèles non-homologues (à plusieurs loci).

La moyenne à la génération m de panmixie s’écrit (Gallais, 1974): Hm — M + 4 GrnE ( A A )

avec n la moyenne de la population panmictique à l’équilibre de liaison (m = oo) et E ( A A ) l ’espérance des effets d ’épistasie additive x additive.

L ’évolution du coefficient de lien au cours des générations d ’intercroisement est présentée sur la figure suivante, en fonction du taux de recombinaisons c.

C o e f f ic i e n t d e lien

F ig u r e 2 .3 4 : É v o l u t i o n du c o e f f ic i e n t de lien au c o u r s d e s g é n é r a t i o n s de m u h i p l i c a i i o n en p a n m i x i e ( d ’après Ba r a d a t, 1982).

(29)

25

5

G é n o t y p e e t P h é n o t y p e

Lorsque l ’on prend un individu i au hasard dans la population, sa valeur génotypique est la valeur prise par une variable aléatoire G, puisque l’individu est tiré au sort. Or les mesures effectuées sur la plante entière observée sur le terrain donnent accès au phénotype de la plante. Ce phénotype correspond à “l ’ensemble des caractères visibles résultant de l ’expression du génotype dans un milieu donné” (Sournia et al, 1991). Le génotype n ’est alors q u ’un concept défini par l’ensemble des expressions possibles d ’une combinaison particulière de gènes. Ainsi, le résultat d ’une mesure sur un individu p a r­ ticulier est la valeur prise par une variable aléatoire P qui s ’écrit:

P — G + E = n + A + D + I + E où / recouvre toutes les interactions d ’épistasie.

E est une variable aléatoire d ’espérance supposée nulle qui rend compte des variations environnementales (effet milieu).

R e m a r q u e sur E :

Les effets milieux sont de plusieurs types. Certains sont plus ou moins systématiques (variations saisonnières) et parfois contrôlables (conditions de culture), d ’autres sont le résu ltat de facteurs difficilement contrôlables et de microphénomènes pouvant être propres à chaque individu.

R e m a r q u e sur E e t G:

On suppose généralement q u ’il y a indépendance entre l ’effet génotype et l’effet milieu, c’est-à-dire q u ’il n ’y a pas d ’interaction génotype x milieu (cov(GE) = 0). Dans le cas contraire les conclusions à venir seraient remises en question.

Si, de plus, on suppose (ju’il n ’y a pas d ’épistasie, le modèle simplifié s’écrit: P = H + A + D + E

avec E ( A ) = E ( D ) = E ( E ) = 0 La variance phénotypique s ’écrit:

2 2 i _2 i 2

a P — ° A + a D + ° E

Les variables aléatoires A, D et E sont supposées, le plus souvent, de loi Normale. La valeur génétique p eu t alors être prévue en connaissant la valeur phénotypique par pré­ diction linéaire.

5.1

H é r i t a b i l i t é s

H é r ita b ilité au sen s large: h SL

L ’héritabilité au sens large donne une indication sur la limite de l’amélioration possible du m atériel étudié (toute chose é ta n t égale par ailleurs). C ’est le degré de confiance dans la prédiction de la valeur génotypique par la valeur phénotypique.

(30)

26 5 G É N O T Y P E E T P H É N O T Y P E

9 9 C OV ( PG)

Sachant que cov(GE) = 0, cov(PG) = donc hSL = ---—v a r P

L ’héritabilité au sens large est le coefficient de régression de G par rap p o rt à P. Il est clair que diminuer a 2E c’est augmenter h2

sL-H é r ita b ilité au sens strict: hgS

L ’héritabilité au sens strict donne une indication sur les gains que l ’on p eu t espérer en créant des populations améliorées. Elle fait intervenir le système de reproduction et la modélisation de son fonctionnement. C ’est le degré de confiance dans la prédiction de la valeur des enfants (en croisement) par la valeur phénotypique de?1 parents.

Deux articles développant le concept d ’héritabilité figurent en Annexes.

5.2

C o v a r ia n c e s e n t r e c a r a c t è r e s

L ’amélioration des plantes est le plus souvent multicaractère, d ’un point de vue ta n t économique que biologique. La connaissance des relations entre caractères perm et de mieux transformer la plante (dans la mesure où to u t caractère lié à un autre caractère apporte une information sur ce dernier) mais aussi de mieux la comprendre dans ses relations avec le milieu.

Sous l ’hypothèse d ’indépendance entre les génotypes et les milieux, la covariance phéno­ typique entre deux caractères 1 et 2 se décompose de la manière suivante:

covPiPi — cov[(G\ + Ei), (G2 4- E 2)] = covG\G2 -f- co vE \E<2

Dans le cas de nombreuses variables, on peut donc écrire:

E

p p =

Ec?g

+

^

EE

où Epp, Y*gg et Ee e sont respectivement les matrices de variances-covariances phéno­

typique, génotypique et environnementale.

Si les corrélations génétiques et environnementales sont de signes opposés, une faible corrélation phénotypique entre deux caractères ne signifiera pas nécessairement une faible corrélation génotypique ( cf Figure ci-dessous). Les corrélations environnemen­ tales dépendent largement de la nature du facteur milieu. De façon générale, toutes ces corrélations sont définies pour une population donnée de génotypes et une population donnée de milieux.

(31)

5.2 Covariances entre caractères 27 Caractère A',1 E , \ i p génétique -r— -E i 'C\ \ Y f \ I i / / ' i ' / V. / /' / \ / f* J '

X /

Gs /

X *gî

/ \ p environnem entale ¡ G \ ' G , E i , £ 2 . . . milieux G\,Gi... génotypes p — corrélation Caractère X i F ig u r e 2 .1 0 : I l l u s t r a t i o n d e s c o r r é l a t i o n s g é n é t i q u e s e t d e s c o r r é l a t i o n s e n v i r o n n e m e n t a l e s e n tr e c a r a c t è r e s . Pour bien le» distinguer, ces corrélations ont é té prises de sens inverse. Ce n ’est évidem m ent pas une situation générale (voir te x te).

Sig n ifica tio n biologique

• Trois phénomènes peuvent être à l ’origine de la liaison génétique entre deux caractères: . le linkage dû à l ’effet de la sélection naturelle qui regroupe au sein d ’une même

unité de ségrégation les gènes dont la combinaison présente un avantage sélectif; . la pléïotropie, situation dans laquelle une unité de ségrégation agit sur plusieurs

caractères, qui est l ’aboutissem ent du processus de sélection naturelle;

. le déséquilibre de liaison dû à l ’effet de dérive (variation aléatoire de la fréquence génétique dans des populations d ’effectif limité) qui entraîne des associations sans signification génétique.

(32)

28 6 T H É O R È M E F O N D A M E N T A L DE LA S É L E C T I O N

6

T h é o r è m e f o n d a m e n t a l d e la s é l e c t i o n

6 .1

C a s d ’u n lo c u s m u lt ia l lè l iq u e

P o s it i o n du p r o b lè m e :

Il s ’agit d ’évaluer comment évoluent, sous l’effet de la sélection, les param ètres de la population.

Soit Pij la fréquence du génotype A iA j et la fréquence de l’allèle i, la c a ra c té r isa tio n de la p o p u la t i o n avant s éle c tio n p eu t être formulée de la manière suivante:

D istribution génique E PiAi pi — Pij

i j

D istribution génotypique ^ Plj A l A 1 ij

En régime panm ictique ( Y ^ p j A j ) 2 = PiiA lA j <=> P,j = p tpj ____________________________ i__________ ij_________________________

La sélection modifie la répartition des fréquences des génotypes en fonction de la prob­ abilité de survie Sy attachée à chaque génotype AiAj.

La probabilité moyenne de survie S = Y . p a .Sij ij

La nouvelle fréquence P[j, après sélection, du génotype A iA j s’écrit comme la probabil­ ité qu’un individu pris au hasard dans la"population sélectionnée ait le génotype A iA j sachant q u ’il a survécu.

p i _ Pjj sij _ p Sij ij ~ V P■■ <! • — ^ 9 r ij ■ °

S ' ' S ' '

Sous l’hypothèse de panmixie : P/¿ = pf et P¡j =

2PiPj-^-Ces expressions m ontrent qu’il n ’est pas nécessaire de connaître les probabilités de survie Sij mais seulement des nombres m^- qui leur sont proportionnels : les valeurs sélectives. En cohérence avec la définition de la valeur sélective génotypique, on mesure la valeur sélective de l’allèle Ai par:

m i = J 2 P j m ij j

En l’absence d ’effet lié au sexe, la valeur sélective du génotype AiA j : = rriji param ètres génotypiques param ètres géniques

( A j A j ) Pjj, Trilj ) (AiiPi^TTii)

Soit la valeur sélective moyenne m =

E

piTTli — jjTYlij — ^ , PiPjm ij

(33)

6.1 Cas d ’un locus multiallèlique 29

la c a r a c té r isa tio n de la p o p u la ti o n après s éle c tio n p eut alors être formulée de la manière suivante : Distribution génique E K A p't = E p !i Distribution génotypique Y l P ' v A i A j p r = p , 3 m iv *3 — y______ __ R em arq ue:

Lorsque l’on sélectionne sur la valeur génotypique, on p eu t considérer que rriij est la valeur de G pour le génotype A i A j ; est alors proportionnelle à gÿ.

Après sélection, à la nouvelle génération, on obtient une population dont les distributions génotypique et génique ont évolué:

frequence du genotype AíAí : Pü = pt ----,771 m fréquence du génotype A l A j : P¡jIJ = 2pipj

rriij-m

1 _ _ jy) ■ •

fréquence de l’allèle A t : p\ = + - £ Píj = H Pij = Pi j ^ r

/ j j H 3 3 m

_ rrij E j Pij _ r r i i P i

m m

L ’évolution des fréquences alléliques d ’une génération à la suivante s’écrit donc:

A Pi = P'i - Pi = Pi ( | r -r l ) = Pi avec rrii — fri l ’excès moyen de l ’allèle Ai

Ainsi, la fréquence d ’un allèle augmente d ’une génération à l’autre si sa valeur sélective est supérieure à la valeur sélective moyenne de la population, elle diminue dans le cas contraire.

L ’évolution de la valeur sélective moyenne s’écrit :

A m = r n - m = Y l p ijm ij ~ Y 1 P‘13 m ij

13 V

Devant cette formule, Fisher propose la démarche suivante: Il choisit une approxim ation de m y par le modèle additif

rriij = rñ + cxi + ctj

cette q uantité est obtenue en minimisant ^ — m — — cxj)4 v

Références

Documents relatifs

(par exemple la quantité de lait), l’instauration d’un quota pour ce caractère, en situation de progrès génétique, aura pour effet de diminuer le nombre total

concernant à la fois la structure de l’exploitation et du troupeau, la qualité des fourrages utilisés (y compris leur composition chimique), les pratiques

Lorsque l’on classe les exploitations par niveau d’effet troupeau (taux butyreux ou taux protéique), on observe 1) que les écarts de taux protéique sont les plus

C’est dans le premier que l’on peut définir sans équivoque la valeur génétique additive d’un individu pour un caractère donné.. Rappelons que cette valeur est

Si, dans une population, on doit admettre que les locus marqueurs et les locus quantitatifs sont en équilibre de liaison, seule une analyse intra-familiale est

Le but de cet exercice est d'estimer l’héritabilité au sens strict et d’analyser l'effet de la variation allélique à ce locus sur le caractère &#34;nombre de grains d’un épi

Organisation de la diversité génétique: Application du principe de Hardy-Weinberg et écarts à la panmixie 4?. Mécanismes évolutifs: Les sources de

• dérive génétique: processus évolutif de fluctuations aléatoires des fréquences alléliques résultant d'un échantillonnage aléatoire.. parmi