1
Mécanismes de réparation des dommages de l'ADN
Eric Quéméneur
Objectifs de cet exposé
- Rappels de quelques notions de base avant l'intervention de JC Artus - Introduire les concepts d'instabilité du génome, les mécanismes de maintien
de son intégrité et les bases moléculaires de la cancérogenèse - Situer les enjeux de la recherche en radiobiologie
Plan de cette courte présentation - Dommages de l'ADN
- rappels des bases structurales
- faire la part des choses (dommages radio-induits vs autres) - conséquences fonctionnelles (du dommage au cancer) - Repérer, identifier le dommage
- exemple de MutS (mismatch) - exemple de γ-H2AX (DSB foci)
- Réparer
- réversion directe par la photolyase
- les grandes voies (BER, NER, MR, HR, NHEJ) - maladies génétiques
- Coordonner l'intervention
- articulation Réparation/Cycle celllulaire ("checkpoints")
- Perspectives et enjeux CEA Marcoule
2
Introduction
On estime que l'ADN d'une cellule humaine moyenne subit plusieurs dizaines de milliers de lésions par cellule et par jour, dans des conditions habituelles d'activité métabolique et d'exposition aux facteurs environnementaux. L'exposition aux rayonnements ionisants n'est qu'un facteur de risque supplémentaire parmi d'autres.
Ces lésions sont globalement néfastes (cancer, vieillissement, etc.) mais la mutagenèse est également un moteur de l'évolution.
Un ensemble très efficace de processus biochimiques identifie, signale et corrige les dommages de l'ADN et contribue ainsi à maintenir l'intégrité du génome cellulaire.
Cette machinerie de "réparation de l'ADN" est toujours active, réactive, finement contrôlée par la cellule et est reliée à plusieurs mécanismes connexes.
Mais cette machinerie n'est pas infaillible ! …la défaillance accroissant le risque cancérogène les facteurs de variabilité sont nombreux : fond génétique individuel, âge, types cellulaires, types de lésions, facteurs environnementaux, etc.
1- Les dommages à l'ADN
3
Rappels sur la structure de la Chromatine et de l'ADN
La particule coeur (core particle):
146 paires de bases
+ un octamère d’histones 2[H2A, H2B]2et [H3,H4]4
4
Structure de l'ADN
Rappel sur la structure des protéines
5
Brochure Environnement-Energie-Santé (2ndeedition, Juin 1997) SFEN Languedoc-Roussillon
Source type de lésion
Evaluation du nombre de lésions induites par cellule et par jour Température corporelle
(37°C)
Ruptures simples Site apuriniques Sites apyrimidiques Déamination
20 000 - 40 000 10 000
500 100-300
Radicaux libres
Dommages des bases (total) Thymine glycol
Thymidine glycol 5-hydroxométhyluracile 8-hydroxométhylguanosine
Ruptures simples, doubles, pontages
10 000 270
70 620 168
?
Métabolismes divers
Adduits glucose N7-méthylG N3-méthylA O6-méthyl G
Pontages ADN/ADN et ADN/protéines
3 4 000
600 10-3
? Dommages endogènes à l'ADN induits par la vie cellulaire
6
Source Type de lésions Nombre d'adduits
induits/cellules
Bain de soleil (1 heure) dimères de thymine 60 000 à 80 000
Tabagisme (20 cigarettes/jour) Adduits sur l'ADN
(hydrocarbures polycycliques) 100 à 200 Travailleurs de fours à charbon
(selon les auteurs et le nombre de jours)
BPDE benzo (α)pyryène diol
époxyde 400 à 70 000
Travailleurs de fonderie BPDE benzo (α)pyryène diol
époxyde 300 à 6 500
Bruit de fond des radiations
naturelles (2,4 à 40mSv/an) Ruptures simple brin 2/an Dommages à l'ADN induits par des agents génotoxiques connus
Modification des sucres ND 800-1000
Sites alcali-labiles ND 200-300
Pontages DNA-Protéines ND 150
(DNA-DNA et DNA-RNA cross links)
7
Effets biologiques des rayonnements
ionisants
Les différentes échelles de temps
Clefs CEA N° 48
Source : Santé, radioactivité et rayonnements ionisants (2003) Brochure du Comité d'Information des Professions de Santé
8
Mutations intra et interchromosomiques
Décalage de cadre de lecture Mutations ponctuelles (inversion de bases) Différents types de mutations
Comment les mutations causent-elles un cancer ?
La prolifération cellulaire est contrôlée finement par la balance entre 2 classes de protéines : - les suppresseurs de tumeurs (ex. p53, RB1, BRCA1…)
- les (proto)oncogènes (ex. ras, myc, wnt…)
TS PO
Bloque cycle cellulaire Inducteur apoptose Réponse Signaux externes
Maintien intégrité génome Réparation dommages ADN
Stimulation croissance et division cellulaire
Une mutation qui : - inactive un TS fournit un avantage sélectif décisif à la - active un PO cellule concernée
tumorogenèse
Système de réparation des mutations de l'ADN = protection contre la cancer
9
Du dommage de l'ADN au cancer : un processus probabiliste
Ratio of the probabilities for radiation induced lethal cancer
and the corresponding DSB is
~10-11~10-12
Complex adaptative systems at various levels
Risk per humam stem cell per 1 mGy*
* Organism
Tissues
Cells
Molecules
Atoms Ionizing
Radiation ~150 ROS
~2 DNA alterations
~10-2DNA DSB
~10-4chromosoma aberr.
~10-14malignant transformation with fatal outcome
?
~ 1020cells at risk
MAIS, SURTOUT,
LA CELLULE DISPOSE D'UN SYSTEME TRES EFFICACE DE REPARATION DE SON ADN !!
2- Repérer les dommages
10 Mismatch recognition by MutS Obmolova et al. (2000) Nature 407, 703-710
Crystal structures of mismatch repair protein MutS and its complex with a substrate DNA
Mécanisme de la réparation de mésappariement
le "contrôle qualité" post-replicationnel
11
La réparation de l’ADN a lieu dans le contexte de la chromatine, les histones jouent également des rôles clefs dans la détection des dommages
Modifications post-traductionnelles des queues des histones
12
13 3- Réparer les dommages
14
Les dommages à l'ADN : mécanismes de réparation
Figure from : Hoeijmakers (2001) Nature 411, 366-374.
Genome maintenance mechanisms for preventing cancer
Mécanisme de la réparation par excision de base (BER),
une tâche de fond pour lutter contre les dommages induits par le métabolisme
15 Structure des composants de la voie BER
on sait presque tout !?
Mécanismes d'excision de nucléotide ( NER) et de réparation couplée à la transcription -Un système global de surveillance très versatile
Le "reparosome", un complexe stable préformé
Gervais et al. (2004) Nature Struct Mol Biol 11, 616 - 622 (2004) TFIIH contains a PH domain involved in DNA nucleotide excision repair
Schulz et al. (2000) Cell 102, 599–607 Molecular Structure of Human TFIIH TFIIH (460 kDa) = 9 sous-unités
2 entités structurales et fonctionnelles - core : p34, p44, p52, p62, XPB helicase - complexe CAK (CDK-activating kinase) :
Cdk7, cyclin H, MAT1 XPD helicase pontant les deux
16
Réparation des cassures double-brin (EJ pathway)
synapsis
microhomology alignment
ligation
Ku86/Ku70 DNA-PKcs Ligase IV XRCC4
trans-
phosphorylationP P
unwinding P P
P
Walker et al. (2001) Nature 412, 607-614 Structure of the Ku heterodimer bound to DNA and its implications for double-strand break repair
17
Junop et al. (2000) EMBO J. 19, 22, 5962
Crystal structure of the Xrcc4 DNA repair protein and implications for end joining Sibanda et al. (2001) Nature Structural Biology 8, 1015 - 1019
Crystal structure of an Xrcc4–DNA ligase IV complex
Evolution of the structural knowledge on DNA repair systems Database (july 10, 2007) = 44578 entries
Query for "DNA repair" = 778 entries
Sorting for non redondant structures = 494 (<30% ident)
18
Hoeijmakers (2001) Nature 411, 366-374. Genome maintenance mechanisms for preventing cancer
XP Patient Cockayne patient AT patient
19 Sensor
DNA damage response and human disease
Signaling
Mediator / Regulator Effector
NHR / HR
Ataxia telangiectasia Fanconi anemia
Nijmegen breakage syndrome Li-Fraumeni
syndrome
Immune deficiency syndromes (inc. SCID)
Familial breast and ovary cancer Bloom's and Werner's
syndromes Sporadic tumors
4- Coordonner l'intervention moléculaire
20
Les différentes options de la cellule face aux dommages de l'ADN
Les "checkpoints" du cycle cellulaire
21
22
Analyse du mécanisme de relocalisation intra-cellulaire de p53
Cartographie fonctionnelle de la protéine
Contrôle Stress Contrôle
Stress
Godon et al. (2005) Oncogene 24, 6459-6464. Quantitation of p53 nuclear relocation in response to stress using a yeast functional assay: effects of irradiation and modulation by heavy metal ions.
Un outil génétique d'analyse de la relocalisation de p53
Etude de mutants Etude des stress synergiques
23
Perspectives - Enjeux des recherches en radiobiologie
Continuer à identifier et caractériser les éléments clés du maintien de l'intégrité du génome Comprendre comment : - ils échappent au contrôle cellulaire
- ils peuvent se maintenir pendant des années - ils peuvent se transmettre
Bases moléculaires de la variabilité individuelle et de la susceptibilité au cancer Faibles doses et synergies avec autres stress cellulaires/facteurs environnementaux
Génétique des populations Chapitre 1 SV5 Page 2
Génétique des Populations
Chapitre 1 : Définition, Objectifs et Applications
La génétique initiée par Gregor Mendel, appelée classiquement g é n é tiq u e m en d él i en n e , a pour objectif de comprendre le déterminisme et la transmission des caractères par l'analyse de la descendance d'un croisement contrôlé entre individus de génotypes différents.
Après la découverte du support de l'information génétique (ADN), la g é n é tiq u e mo lé c ul ai r e continue à rechercher les mécanismes fins du déterminisme, de l'expression et de la transmission des caractères.
La compréhension du déterminisme et de la transmission des caractères doit aussi étudier les individus dans les conditions naturelles où ils sont génétiquement uniques et libres de se reproduire avec n'importe quel autre individu de la même espèce.
Cette partie de la génétique, qui considère les individus en interactions avec leur environnement, est l a g én é t iqu e d es po pu l at io n s .
A) Définitions et objectifs
La génétique des populations étudie la variabilité génétique présente dans et entre les populations avec 3 principaux objectifs : 1 - me su r er la va ri a bi li té g é n ét iqu e , app el ée au ss i d iv er si té g é nét iq ue , pa r la fr é qu en ce d es d i ffé r en t s a l lè le s d’ un mê me gè n e.
2 - c o mpr e nd re c omm e nt l a v a ri a bi li té gé n é tiq ue se
t r an sm et d 'une gé n ér at io n à l 'a ut r e
Génétique des populations Chapitre 1 SV5 Page 3
3 - c omp re nd re com me n t et pou rquo i l a v ar ia bi li té g é n ét iqu e évo lu e au fi l d es gé n é ra tio ns .
Si la génétique mendélienne se base sur des croisements contrôlés par un expérimentateur, la génétique des populations étudie les proportions des génotypes au sein d'un ensemble d'individus issus de croisements non contrôlés entre de nombreux parents. C'est donc une application des principes de base de la génétique mendélienne à l'échelle des populations fig.1.
fig.1
B ) Qu'appelle-t-on population ?
Une population est l'ensemble des individus de la même espèce qui ont la possibilité d'interagir entre eux au moment de la reproduction.
Exemples :- Eléphants d’un parc national africain -Les chênes d’une zone forestière
-Les individus d’une espèce de parasite intestinal, présent chez un seul individu hôte
II-Variabilité génétique dans les populations naturelles
Une particularité du monde vivant est la variabilité des phénotypes
individuels. A l'intérieur d'une espèce, il n'existe pas 2 individus
Génétique des populations Chapitre 1 SV5 Page 4
ayant exactement les mêmes caractéristiques phénotypiques:
l'individu est unique. Certaines de ces variations s'expriment au niveau phénotypique (morphologie, physiologie, comportement, etc.) mais les autres restent "cachées" et leur mise en évidence nécessite l'utilisation de techniques adaptées (variabilité des protéines ou des séquences d'ADN).
Les variations du phénotype (P) sont dues pour une partie à des facteurs environnementaux (E) (alimentation, climat, interactions avec les autres espèces, etc.) et pour d’autre partie à des différences entre les génotypes individuels, transmissibles à la descendance (G) cette partie sera développer en génétique quantitative.
A ) Déterminisme des variations : notion de polymorphisme La génétique des populations s'intéresse principalement à la variabilité d'origine génétique présente dans les populations et que l'on désigne sous le nom de polymorphisme. (couleur, forme, d'ADN présente une variation de séquence correspondant à plusieurs formes alléliques, etc)
Par opposition, on appelle monomorphes les gènes qui ne présentent pas de variabilité (un seul allèle présent dans la population).
1) Déterminisme épigénétique
Lorsque la variabilité d'un caractère n'a aucune base génétique, c'est à dire ne fait pas intervenir de modification de séquence d'ADN, elle est qualifiée de variabilité épigénétique. Cette variabilité résulte souvent de l'action des facteurs environnementaux sur l'expression phénotypique d'un caractère (température, alimentation, physico- chimie de l'environnement, etc.).
2 ) Déterminisme génétique
La variabilité d'un caractère est déterminée génétiquement
lorsqu'elle est due, au moins en partie, à la présence de plusieurs
formes alléliques dans la population.
Génétique des populations Chapitre 1 SV5 Page 5
Dans certains cas, la variabilité phénotypique est due à la variation d'un seul gène = déterminisme monogénique. Cela ne veut pas dire que le caractère est contrôlé par un seul gène mais que la variation d'un seul de ces gènes est suffisante pour entraîner une variation phénotypique. On parle alors de caractères mendéliens. Chez l'homme, environ 5000 caractères mendéliens sont connus.
Dans d'autres cas, la variabilité d'un caractère est déterminée par un grand nombre de gènes ayant chacun plusieurs allèles. On parle de déterminisme polygénique. C'est le cas de tous les caractères quantitatifs qui font l'objet d'une mesure comme la taille, le poids, etc. L'analyse génétique de ces caractères relève de la génétique quantitative qui sépare les effets des gènes en effets additifs A, effets de dominance D, effet d'épistasie ou d'interaction entre gènes I:
G = A + D + I
B) Étendue et méthodes d'étude de la variabilité
Historiquement, la recherche des variations génétiques dans les populations naturelles a concerné des caractères directement accessibles à l'observateur (morphologie, couleur, etc). Le développement des techniques de biochimie, cytogénétique et de biologie moléculaire ont permis d'étudier la variabilité génétique à des échelles plus fines, jusqu'au niveau de la séquence d'ADN, permettant même l'étude du polymorphisme des régions non codantes.
1) Polymorphisme morphologique
C'est le polymorphisme de taille, de forme, de couleur etc. La variabilité génétique de la couleur de certaines espèces, appelée polychromatisme, est certainement l'un des polymorphisme qui a été le plus étudié. Un exemple célèbre est la variation de la couleur et de l'ornementation de la coquille de l'escargot du genre Cepaea. En un même endroit coexistent plusieurs formes phénotypiques
déterminées par plusieurs gènes polymorphes: des escargots à
coquille rose, jaune ou brune, et des escargots sans bande et avec
bandes dont le nombre varie entre 1 et 5. Figure 2
Génétique des populations Chapitre 1 SV5 Page 6
Fig.2 2) Polymorphisme des protéines
a)Polymorphisme enzymatique
Depuis les années 1960, la variabilité des protéines est étudiée par électrophorèse. Les protéines sont des molécules chargées qui se déplacent dans un support poreux (gel d’agarose, d’amidon, de
polyacrylamide, d'acétate de cellulose) lorsqu’elle celui-ci est soumis à un champ électrique. Figure 3
Fig.3
La vitesse de migration dépend de la charge globale de la protéine,
de sa taille et de sa conformation. Toute mutation dans la séquence
d'un gène codant pour une protéine peut modifier le sens d'un codon,
altérer la séquence d'acides aminés donc la charge électrique de la
protéine et sa vitesse de migration. Ce changement de structure
primaire peut être détecté par électrophorèse qui sépare les
Génétique des populations Chapitre 1 SV5 Page 7
variants protéiques ayant des vitesses de migration différentes appelées souvent F (fast) et S (slow).
La mise en évidence de différents allèles d'un même gène est possible pour les enzymes grâce à la spécificité de la réaction enzyme-substrat visualisée par une réaction colorée. L'existence de variations génétiques à un locus donné est détectée par la présence de différents niveaux de migration dans le gel d'électrophorèse, qui sont associés à des allèles différents appelés allozymes. fig.4
Fig.4
Représentation schématique d'un gel d'électrophorèse pour différents systèmes génétiques :
a) cas d'une protéine monomérique codée par un gène à deux allèles (F = Fast et S = Slow);
b) cas d'une protéine monomérique codée par un gène à trois allèles (V = very Fast, F = Fast et S = Slow);
c) cas d'une protéine dimérique codée par un gène à deux allèles (F = Fast et S = Slow) ou les hétérozygotes sont représentés par 3 bandes.fig.5
Fig.5
Génétique des populations Chapitre 1 SV5 Page 8
b) Polymorphisme immunologique
La variabilité de certaines protéines peut être étudiée par des techniques d'immunologie. Classiquement, il s'agit de mesurer la spécificité et l’affinité des réactions antigènes-anticorps lorsque l'on fait réagir un anticorps, produit contre un antigène défini, avec des antigènes d’origines variées (hétérologues).
Chez l’homme, le polymorphisme immunologique le plus étudié est celui des antigènes présents à la surface des globules rouges dont les plus connus sont le système ABO, le système rhésus (allèle Rh+ dominant sur Rh
–), le système MN (M et N codominants).
Pour le système ABO, les allèles A et B sont codominants entre eux et tous les deux dominants sur l'allèle O ce qui donne la typologie antigènes/anticorps suivante :
Génotype Antigène Anticorps I
AI
AI
AI
OGroupe
A Anti B
I
BI
BI
BI
OGroupe
B Anti A
I
AI
BGroupe AB
Ni anti A, ni anti B Receveur universel
I
OI
OGroupe
OO Anti B, anti A Donneur universel
De fortes variations géographiques existent pour les fréquences des allèles du
système ABO à l'échelle des continents.fig6
Génétique des populations Chapitre 1 SV5 Page 9
Fig .6 3) Polymorphisme chromosomique
Ce polymorphisme peut être dû soit à une variation du nombre des chromosomes (euploïdie, aneuploïdie) soit à un changement de leur structure (délétion, duplication, inversion, translocation). Par exemple, chez une graminée Dactylis glomerata , il existe plusieurs catégories d'individus, certains étant diploïdes c'est-à-dire ayant 2N chromosomes, d'autre tétraploïdes à 4N chromosomes.fig.7
Fig.7
Un autre exemple de polymorphisme chromosomique bien connu est
celui des inversions chromosomiques observées chez la drosophile
américaine Drosophila pseudoobscura . De très nombreuses inversions
différentes ont été observées chez cette espèce de Drosophile.
Génétique des populations Chapitre 1 SV5 Page 10
fig.8 4) Polymorphisme de l'ADN
Les techniques issues de la biologie moléculaire permettent de rechercher des variations dans les séquences nucléotidiques de l'ADN et sont de plus en plus utilisées pour étudier le fonctionnement génétique des populations.
Parmi l'ensemble des techniques disponibles, il faut distinguer celles qui permettent de mettre en évidence une variabilité dispersée dans tout le génome. Les marqueurs révélés sont alors multi locus et dominants.
D'autres techniques permettent de révéler une variabilité à des endroits plus limités du génome. Les marqueurs sont souvent qualifiés de mono locus et souvent codominants.
Il faut également distinguer parmi ces techniques celles qui nécessitent uniquement une extraction de l'ADN des individus étudiés de celles qui nécessitent une amplification in vitro d'une portion définie d'ADN par PCR (polymerase chain reaction).
Exemple de marqueurs moléculaires utilisés en génétique des populations : Polymorphisme RFLP (Restriction fragment Length Polymorphism) et PCR-RFPL.
Figure 9
Génétique des populations Chapitre 1 SV5 Page 11
Fig.9
C) Mesure de la diversité génétique
Fréquences alléliques et fréquences génotypiques
Lorsqu'une population est polymorphe pour un caractère donné, il est possible de calculer la fréquence des phénotypes observés.
Par exemple dans une population de N individus dont Nn ont le corps noir et Nb le corps blanc, les fréquences phénotypiques de la population pour le caractère couleur du corps sont les suivantes : fréquence du phénotype noir f[n] = Nn/N
fréquence du phénotype blanc f[b] = Nb/N
Si ce caractère est gouverné par un gène à deux allèles A et a autosomaux, avec a récessif responsable de la couleur blanche, les génotypes AA et Aa correspondent au phénotype noir et le génotype aa au phénotype blanc. Les fréquences phénotypiques permettent alors uniquement de connaître la fréquence du génotype aa puisque parmi les individus noirs, on ne peut pas distinguer les génotypes AA des génotypes Aa . La fréquence des allèles A et a ne peut également pas être calculée.
Si la couleur du corps des individus présente non plus 2 mais 3 phénotypes (noir, jaune et blanc) gouvernés par un couple d'allèles A
1et A
2autosomaux et codominants, les trois génotypes possibles A
1A
1,
A
1A
2et A
2A
2peuvent être distingués puisqu'ils correspondent à des
Génétique des populations Chapitre 1 SV5 Page 12
phénotypes différents (respectivement noir, jaune et blanc). La composition phénotypique de la population correspond alors à sa composition génotypique et si on appelle Nn, Nj et Nb les nombres d'individus présentant les phénotypes noir, jaune et blanc, on peut facilement calculer les fréquences génotypiques dans cette population :
f( A
1A
1) = Nn/N = D f( A
1A
2) = Nj/N= H f( A
2A
2) = Nb/N = R Ainsi, pour un locus donné, une population est complètement décrite si l'on connaît la fréquence de chacune des catégories génétiques.
Dans le cas d'un système diallélique A et a , la structure d'une population d'effectif N est complètement connue si l'on connaît les effectifs N
AAde AA , N
Aade Aa et N
aade aa avec N = N
AA+ N
Aa+ N
aaà partir desquels on calcule les fréquences relatives des trois génotypes.
A partir des fréquences génotypiques, il est facile de calculer les fréquences alléliques dans la population, c'est à dire les fréquences des différents états alléliques du locus considéré. Dans le cas d'un gène autosomal à deux allèles A et a , la fréquence de l'allèle A est le rapport du nombre d'allèles A au nombre total d'allèles à ce locus, soit 2N pour une population de N individus diploïdes:
- les N
AAindividus AA sont porteurs de deux allèles A - les N
Aaindividus Aa d'un allèle A et d'un allèle a - les N
aaindividus aa de deux allèles a .
Le nombre d'allèles A dans la population est donc 2N
AA+ N
Aa. Les fréquences p et q des allèles A et a sont alors les suivantes:
f( A )= = (2 N
AA+ N
Aa)/2N
f( a )= q = (2N
aa+ N
Aa)/2N avec p + q = 1
Autrement dit si D et R sont les fréquences des homozygotes AA et aa , H la fréquence des hétérozygotes Aa , les fréquences alléliques peuvent aussi être calculées à partir des fréquences génotypiques : f( A ) = p = D + H/2
f( a ) = q = R + H/2
Ces fréquences p et q représentent également une estimation de la
probabilité qu'un gamète mâle ou femelle porte l'allèle A ou l'allèle a .
Génétique des populations Chapitre 1 SV5 Page 13
Il est important de noter que les fréquences alléliques comportent moins d'information que les fréquences génotypiques car on perd la manière dont les allèles sont associés 2 à 2 dans les génotypes individuels.
Exemple : du groupe sanguin MN chez l'homme L’examen de 730 aborigènes australiens a donné les résultats suivants :
Groupe sanguin Génotype Nombre Fréquence
[M] MM 22 0.03
[MN] MN 216 0.30
[N] NN 492 0.67
Les fréquences alléliques calculées par les deux méthodes sont les suivantes:
Génétique des populations SV5 chapitre 2 Page 15
CHAPITRE 2 : Équilibre de Hardy Weinberg
Dans un cas simple appelé p o p u l a t i o n t h é o r i q u e i d é a l e , qui se définit par les caractéristiques suivantes :
1) population d'organismes d i p l o ï d e s à r e p r o d u c t i o n s e x u é e et à g é n é r a t i o n s n o n c h e v a u c h a n t e s (aucun croisement entre individus de générations suivantes)
2) population d'e f f e c t i f i n f i n i où les croisements sont entièrement a l é a t o i r e s
3) p o p u l a t i o n c l o s e génétiquement (absence de flux migratoires)
4) tous les individus, quel que soit leur génotype, ont la même capacité à se reproduire et à engendrer une descendance viable = absence de sélection 5) A b s e n c e d e m u t a t i o n et de distorsion de ségrégation méïotique (un individu Aa produira toujours 50% de gamètes A et 50% de gamètes a).
Parmi toutes ces caractéristiques, le croisement au hasard des individus, appelé système de r e p r o d u c t i o n p a n m i c t i q u e , est l'hypothèse la plus importante. Cette hypothèse suppose que les individus ne choisissent pas leur partenaire sexuel ni en fonction de leur génotype, ni en fonction de leur phénotype = p a n m i x i e et que la rencontre des gamètes se fait au hasard = p a n g a m i e .
A - CONSTITUTION GENETIQUE DES POPULATIONS
1- Définitions :
Pour définir la constitution génétique d'une population plusieurs niveaux, phénotypique, génotypique et génique sont utilisés. Ils sont décrits par une loi de probabilité. Ainsi pour une variable donnée (le caractère: couleur des yeux) on précisera les différents états possibles (bleu, vert, marron ...) et les probabilités avec lesquelles ces états se rencontrent dans la population étudiée (0,10 ; 0,20 ; 0,60 ...). Ce premier descripteur est la constitution phénotypique de la population.
2- Exemples d'Estimation de constitutions génétiques
2.1 Cas de gènes autosomiquesSoit une population de N individus diploïdes à reproduction sexuée biparentale, étudiée pour un caractère à déterminisme monogénique. On y observe trois classes
Génétique des populations SV5 chapitre 2 Page 16 génotypiques d'effectifs respectifs (A1A1) n1, (A1A2) n2, (A2A2) n3, avec n1 + n2 + n3 = N. Le déterminisme génétique étant connu, un couple d'allèles autosomiques A1, A2 codominants, la constitution génotypique de la population correspond à sa constitution phénotypique. Les fréquences génotypiques sont alors exactement définies par les rapports :
freq (A1A1) = f1 = D = n1/N freq (A1A2) = f2 = H = n2/N freq (A2A2) = f3 = R = n3/N
p = (2n1 + n2)/2N = D + 1/2 H q = (2n3 + n2)/2N = R + 1/2 H.
2.2 Cas de gènes liés au sexe (ou de gènes d'un système haplo-diploïde) : Soit A1 et A2 des allèles situés sur l'hétérochromosome commun aux deux sexes.
Dans une population où l'on dénombre N1 individus de sexe homogamétique et N2 de sexe hétérogamétique, le nombre de gènes concernés est de 2N1 + N2. Notons n1, n2, n3, les effectifs des génotypes A1A1, A1A2, A2A2 chez les femelles, et m1 et m2 ceux des génotypes A1 et A2 chez les mâles. En considérant chaque groupe sexuel comme un échantillon indépendant, on peut estimer la fréquence de l'allèle A1 pour chacun des sexes et pour l'ensemble de la population :
p= (2n1 + n2)/2N1 p’ = m1/ N2 P = (2n1 + n2 + m1)/(2N1 + N2) (femelles) (mâles) (l’ensemble de la population)
B- DEFINITION DU MODELE DE HARDY-WEINBERG
1 - L'Hypothèse panmictique :
1.1 CAS DE GENES AUTOSOMIQUES 1. 1. 1 RENCONTRE DES GAMETES
Lorsque la rencontre des gamètes se fait au hasard, on dit qu'il y a pangamie;
lorsque la rencontre des individus se fait au hasard, ont dit qu'il y a panmixie.
Dans l'hypothèse panmictique, chaque nouveau zygote formé résulte de deux tirages au sort indépendants, l'un dans l'urne des ovules, l'autre dans l'urne des spermatozoïdes. Ces urnes sont respectivement composées de l'ensemble des ovules matures fournis par les femelles de la population au moment du tirage et de l'ensemble des spermatozoïdes matures fournis par les mâles de la population au moment du tirage. Les probabilités de chaque nouveau zygote sont donc : A1A1 = p2 A1A2 = 2pq A2A2 = q2.
On retrouve la relation : (p +q) 2 = p2+ 2pq + q2 = 1,
1.1.2 RENCONTRE BASE SUR LES CROISEMENTS DES INDIVIDUS
Génétique des populations SV5 chapitre 2 Page 17 Considérons le cas d’un locus avec deux allèles et une population infinie où les fréquences des trois génotypes ont des valeurs quelconques à la génération n.
Génotypes et fréquences des mâles A1A1 A1A2 A2A2 D H R ________________________________
Génotypes A1A1 D D2 DH DR et fréquences A1A2 H DH H2 HR des femelles A2A2 R DR HR R2
A1A1 A1A2 A2A2 A1A1 x A1A1 D2 1 - - A1A1 x A1A2 2DH 1/2 1/2 - A1A1 x A2A2 2DR - 1 - A1A2 x A1A2 H2 1/4 1/2 1/4
A1A2 x A2A2 2RH - 1/2 1/2 A2A2 x A2A2 R 2 - - 1
total 1 D1 H1 R1 D1 = D2 + 1/2(2DH) +1/4(H2) = p2
H1= 1/2(2DH) + (2DR) + 1/2H2 +1/2(2RH) = 2(D+1/2H)(R+1/2H) = 2pq R1 = R2 +1/2(2RH) + 1/4 H2 = q2
La structure génotypique restera identique au cours des générations ultérieurs puisque les proportions D, H et R ne dépendent que de p et q .
2. Cas d'un locus situé sur un hétérochromosome (et gènes d'un système haplo-diploïde)
Lorsqu'un gène est situé sur un hétérochromosome, le sexe homogamétique possède deux locus et le sexe hétérogamétique un seul.
Si les deux sexes sont en nombre égal dans la population, 2/3 des allèles liés au sexe seront portés par le sexe homogamétique(p) et 1/3 par l'autre sexe(p’). Pour un taux sexuel différent, il suffit de pondérer les proportions par les effectifs de chaque sexe.
P=2/3p + 1/3p’
2.1 CONSTITUTIONS GENETIQUES A L'ETAT D'EQUILIBRE femelles mâles
A1 A1 A1 A2 A2 A2 A1 A2 p2 2 p q q2 p’ q’
La fréquence de l'allèle A1 est égale à p=p’ dans chaque sexe, elle restera inchangée dans les deux sexes après une génération en reproduction panmictique. Le même
Génétique des populations SV5 chapitre 2 Page 18 raisonnement est vrai quel que soit le numéro d'ordre de la génération. Nous sommes en présence d'un état d'équilibre.
2.2 L'ATTEINTE DE L'ETAT D'EQUILIBRE
Même si la fréquence allélique n'est pas identique dans les deux sexes, il est évident que, sous les hypothèses de la loi de Hardy-Weinberg, la fréquence allélique pour l'ensemble de la population ne variera pas puisque aucun facteur évolutif n'agira. Par contre, nous allons montrer que la distribution des fréquences alléliques, dans chaque sexe, varie en oscillant, tout en se rapprochant de la position d'équilibre.
p’ n = p n-1 p n = 1/2 pn-1+ 1/2 p’ n-1 En = p n-p’ n Eo = po-p’o En=(-1/2)nEo On déduit alors les relations :
Lorsque n augmente, (-1/2)n tend vers zéro et la fréquence allélique A1 des femelles tend vers p=pn=p’n=(2p0+p’0)/3.
A titre d'exemple considérons le cas extrême d'une population de base dans laquelle toutes les femelles sont A2A2 et tous les mâles A1Y. Soit 0 la fréquence de l'allèle A1 chez les femelles et 1 chez les mâles.
C - SYSTEMES MULTI-LOCUS
1- Etude d'un système à deux locus autosomiques :
1.1 Constitutions gamétique et génotypique à l'équilibre
Soient deux locus différents A et B pouvant être occupés le premier par les allèles A ou a et le second par les allèles B ou b. Il n'est pas nécessaire de dissocier le cas de locus situés sur un même chromosome (physiquement liés) de celui de locus situés sur des chromosomes différents, étant donné que la probabilité (c) de recombinaison entre les deux locus n'intervient pas sur la constitution génétique à l'équilibre, comme nous le verrons ultérieurement. Dans le cas de locus physiquement liés, (c) est comprise entre 0 et 1/2 si ces locus sont suffisamment proches (génétiquement liés) et égale à 1/2 si les locus sont très éloignés (génétiquement indépendants). (c) est également égale à 1/2 si les locus sont situés sur des chromosomes différents (physiquement indépendants).
(pA + pa)2 et ( pB + pb)2
Pour les deux locus pris simultanément, la constitution génotypique globale, à l'équilibre, sera donnée par le développement du produit de ces binômes soit :
2po+ p’o po - p’o p’n =
---+ (-1 /2)
n -1---
3 3 2po+ p’o po - p’o pn =
---+ (-1 /2)
n---
3 3
Génétique des populations SV5 chapitre 2 Page 19 [(pA + pa)2 (pB +pb)2] .
Il existe quatre types de gamètes possibles : AB, Ab, aB et ab, de fréquences respectives pApB, pApb, papB et papb. On donne souvent le nom d'haplotype à ces combinaisons gamétiques: par exemple haplotype AB. Si les gènes considérés sont associés au hasard dans les gamètes, la fréquence de chaque haplotype sera simplement égale au produit des fréquences des allèles respectifs qui le constitue.
Dans ce cas la population est à l'état d'équilibre de Hardy-Weinberg et on dit à l’équilibre d'association gamétique ou simplement équilibre d'association. On emploie parfois le terme d'équilibre de liaison (linkage equilibrium). Cette appellation n'est cependant pas très appropriée dans la mesure où elle laisse croire qu'il s'agit de gènes physiquement liés. En fait le raisonnement est valable pour tous les locus. Les états d'équilibre des différentes constitutions génétiques seront identiques, que les locus soient physiquement liés ou non. Comme nous le démontrerons, seule la vitesse d'atteinte de l'état d'équilibre dépend du pourcentage de recombinaison.
Si à une génération donnée l'association aléatoire des allèles n'est pas réalisée lors de la formation des gamètes, certains haplotypes présenteront des fréquences supérieures, ou inférieures, à celles attendues à l'équilibre. La population n'est donc pas à l'état d'équilibre. Pour l'haplotype AB on peut alors écrire :
AB = pApB + D,
où D est une valeur relative qui représente le déséquilibre d'association gamétique (dit aussi, mais de façon moins correcte, déséquilibre de liaison ou "linkage disequilibrium"). Les fréquences des autres haplotypes seront modifiées avec la même valeur absolue. En effet, si la fréquence d'association des allèles est modifiée, les fréquences alléliques, elles, ne le sont pas, car la population est toujours régie par le principe de Hardy-Weinberg. La somme des fréquences des haplotypes AB et Ab par exemple, qui regroupent tous les allèles A, doit être égale à pA. Ceci implique que la fréquence des haplotypes Ab soit :
Ab = pApb - D.
Dans ces conditions D est différent de zéro et la population est effectivement en déséquilibre d'association gamétique. Les fréquences gamétiques réelles, fonctions des fréquences à l'équilibre et de D (Lewontin et Kojima, 1960, Evolution 14:458), s'écrivent :
AB = pApB + D et D=AB - pApB Ab = pApb - D aB = papB - D ab = papb + D, On en déduit alors : D = AB.ab – aB.Ab.
2 - L'approche de l'état d'équilibre
L'atteinte de l'état d'équilibre est fonction du degré de recombinaison entre les locus (génétiquement indépendants: c=0.5, ou non indépendants: c < 0,5).
Génétique des populations SV5 chapitre 2 Page 20 Pour démontrer que la constitution gamétique de la population tend vers un état d'équilibre, il convient d'établir les relations de récurrence des fréquences gamétiques entre deux générations successives. Raisonnons sur la fréquence des gamètes AB. Un gamète AB peut être obtenu de deux façons exclusives. S'il est produit sans recombinaison (probabilité 1 - c), sa probabilité d'être AB est égale à la fréquence des AB de la génération précédente, soit AB(n-1). S'il est produit par recombinaison (probabilité c), les deux gènes A et B proviendront de parents différents (probabilité pApB). En effet, sous l'hypothèse panmictique, la probabilité de tirer A et B est simplement le produit pApB, puisque ces allèles sont tirés au hasard dans l'urne gamétique de chaque parent. Sous les hypothèses de la loi de Hardy-Weinberg ceci reste vrai quelle que soit la génération considérée, les fréquences alléliques de chacun des locus étant constantes.
La probabilité totale d'obtention d'un gamète AB s'écrit donc : AB(n) = (1 - c) AB(n-1) + c pApB
En retranchant pApB à chacun des deux membres on obtient :
C’est-à-dire : Dn = (1 - c) Dn-1
Cette relation étant valable à chaque génération, on obtient finalement :
D0 est le déséquilibre d'association gamétique dans la population initiale. (1-c) <1, (1-c)n tend vers zéro lorsque n augmente, et donc Dn tend vers zéro. Le raisonnement s'applique de la même manière pour les autres types de gamètes et la population tend vers l'état d'équilibre d'association gamétique.
Exemple :
Pour illustrer la façon dont une population tend vers l’équilibre, considérons la fusion de 2 populations d’effectifs égaux et toutes les homozygotes pour les 2 locis considérés.
AABB (1/2) aabb (1/2) 1) à la génération initiale Go :
les gamètes sont AB (1/2) ab(1/2) les fréquences allèliques sont : pA=1/2 pB= 1/2 pa=1/2 pb=1/2 et Do= AB-pApB=1/4
2) à la génération suivante G1 :
après un cycle de reproduction panmictique les génotypes des individus sont :
AABB 1/4 AaBb 1/2 aabb 1/4 AB = ab =3/8 Ab= aB=1/8 3) à la génération Gn :
ABn = pApB+ (1-c) n (ABo-pApB)=1/4+(1/2)n(1/2-1/4) = 1/4(1+1/2n) Dn = (1-c)n Do = (1/2)n1/4
N.B Les deux loci sont considérés indépendants
AB(n) - pApB = (1 - c)[ AB(n-1) – pApB]
Dn = (1- c)n D0
Génétique des populations SV5 chapitre 3 Page 21
Chapitre 3 : Croisements non panmictiques
Homogamie et consanguinité
Chez de nombreuses espèces, les croisements ne se réalisent pas au hasard. L'hypothèse de panmixie n'étant pas respectée, la structure génétique des populations va s'écarter de celle d'une population théorique idéale. Ces croisements non aléatoires des individus d'une population peuvent soit correspondre à des appariements plus fréquents entre individus de phénotypes ou de génotypes déterminés
= homogamie (assortative mating), soit être la conséquence de croisements entre individus apparentés = consanguinité. Ces deux cas doivent être distingués car ils n'ont pas les mêmes conséquences sur la structure génétique des populations.
A) Homogamie 1) Définition
L'homogamie correspond des croisements entre phénotypes ou génotypes particuliers qui sont plus fréquents que ceux attendus sous l'hypothèse de panmixie. L'homogamie peut résulter d'un choix des conjoints sur la base de leur ressemblance ou dissemblance phénotypique. Le choix des partenaires peut impliquer des critères morphologiques, comportementaux ou sociaux. L'homogamie est généralement positive car elle implique souvent des croisements entre individus phénotypiquement semblables. Cependant, dans certains cas, des croisements plus fréquents se réalisent entre individus de phénotypes (ou de génotypes) différents (homogamie négative). L'homogamie peut être totale ou partielle si tout ou seulement une partie des couples se forment sur la base d'un choix.
Les conséquences de l'homogamie sur la structure génétique des populations se traduiront par une modification de la fréquence des génotypes pour les caractères impliqués dans l'appariement sans que les fréquences alléliques à ces loci soient modifiées. Les fréquences génotypiques de tous les autres loci seront modifiées.
Cette modification des fréquences génotypiques est facilement
prévisible dans le cas de :
Génétique des populations SV5 chapitre 3 Page 22 2) l'homogamie génotypique positive totale (HGPT) :
Où chaque individu d'un génotype donné se croise avec un individu de même génotype.
AA Aa aa AA x AA Dn-1 1 - - Aa x Aa Hn-1 ¼ ½ ¼ aa x aa Rn-1 - - 1
_________________________________________________
Total 1 Dn Hn Rn
- les génotypes AA se croisent entre eux et produisent 100% de AA - les génotypes aa se croisent entre eux et produisent 100% de aa - les génotypes Aa se croisent entre eux et produisent 1/4
d'individus AA, 1/4 d'individus aa et 1/2 d'individus Aa.
Ainsi, à chaque génération, la fréquence des homozygotes augmente alors que celle des hétérozygotes diminue de moitié.
L'évolution des fréquences génotypiques est alors donnée par les formules de récurrence suivantes où n représente la génération et les fréquences des génotypes AA, Aa et aa sont respectivement D, H et R :
AA Dn+1 = Dn + 1/4 Hn Aa Hn+1 = 1/2 Hn
aa Rn+1 = Rn + 1/4 Hn
A chaque génération, les fréquences alléliques resteront stables car : f(A) = D
n+1+ 1/2H
n+1= D
n+ 1/4 H
n+ 1/2 x 1/2 H
n= D
n+ 1/2H
n= p f(a) = R
n+1+ 1/2H
n+1= R
n+ 1/4 H
n+ 1/2 x 1/2 H
n= R
n+ 1/2H
n= q Cette évolution atteint rapidement un équilibre avec une absence totale d'hétérozygotes. La population sera composée uniquement d'homozygotes AA en proportion p et d'homozygotes aa en
proportion de q.
Si, l'homogamie n'est pas totale, la population atteindra un état d'équilibre où les hétérozygotes seront présents mais à un taux plus faible que si les croisements se réalisaient au hasard. Si l'homogamie est négative, les croisements se font préférentiellement entre
individus de génotypes différents ce qui a pour conséquence
Génétique des populations SV5 chapitre 3 Page 23 d'augmenter la proportion des hétérozygotes qui se maintiennent à un taux plus élevé que si la population suivait le modèle panmictique.
Coefficient de corrélation gamétique :
Considérons un couple de gènes autosomal A et a de fréquence p et q. supposons que le cycle est non panmictique : la structure génotypique à la génération n sera :
AA D
n= p
2+ F
npq Aa H
n= 2pq(1-F
n) aa R
n= q
2+ F
npq
Le paramètre F est toujours compris entre moins un et plus un (-1<F<1). C’est le coefficient de corrélation gamétique. F=0 dans le cas de la panmixie.
Examinons la variation du coefficient de corrélation gamétique dans le cas de l’homogamie génotypique positive totale :
D
n+1= Dn +1/4H
nH
n+1= 1/2H
nR
n+1= R
n+ 1/4R
nH
n+1= 1/2H
n2pq(1-F
n+1) = 1/2(2pq(1-F
n))
1-F
n+1=1/2 (1-F
n) F
n+1= 1/2(1+F
n)
pour F
0= 0 :
Exemples :
3) . Homogamie génotypique positive partielle (HGPP) :
Considérons une population dont le polymorphisme est
conditionné par un locus autosomal A-a avec (1 - λ) se reproduisant
par panmixie et λ se reproduisant en régime d’homogamie
Génétique des populations SV5 chapitre 3 Page 24 génotypique positive absolue. La fréquence des hétérozygotes à la génération n est :
La résolution de cette équation de récurrence permet de connaître l’évolution de la population au cours des générations successives en supposant que le système de reproduction ne varie pas :
Si n tend vers une génération infinie Hn = He = 4(1- λ)pq/(2- λ).
On peut exprimer Fn en fonction λ de n et de Fo :
1-Fn =( λ /2)(1-Fn) +(1- λ )
4-Homogamie phénotypique positive totale (HPPT) :
Nous supposons qu’au locus considéré l’un des allèles soit A est dominant sur l’autre :donc au point de vue du choix du conjoint, les homozygotes AA et aa se comporte exactement de la même manière. tous les individus de phénotype [A] se croisent entre eux et représentent une proportion de (1-R) et tous les non [A]
entre eux dans une proportion [R].les différents types de croisements sont : AA Aa aa
AA x AA D²/ (1-R) 1 - - AA x Aa 2DH/ (1-R) 1 /2 1/2 - Aa x Aa H²/ (1-R) 1/4 1/2 1/4 aa x aa R - - 1 1 D1 H1 R1
La génération suivante :
D1= D²/(1-R) + 1/2 [2DH²/(1-R)] + 1/4 [H²/(1-R)] = (D+1/2H)²/(1-R) = 2p²/(2p+H)
H1= H(D+1/2H)²/(1-R) = 2pH/(2p+H) R1= R+1/4H²/(1-R) = 1-D
1-H
1Les conséquences de tels mariages peuvent être plus clairement mises en évidence par la résolution de l’équation de recurrence pour la proportion des hétérozygotes.
Hn = λ(Hn-1)/2 + (1- λ) 2pq
Hn = 4(1- λ)pq/(2- λ) + (λ/2)
n[Ho – 4(1- λ)pq/(2- λ)]
Fn = λ/(2- λ) +( λ/2)
n[Fo- λ/(2- λ)]
Génétique des populations SV5 chapitre 3 Page 25 Hn = (2pHn-1)/(2p+Hn-1)
1/Hn = 1/Hn- 1 + 1/2p
On peut exprimer Fn en fonction de n : 1/Hn = 1/(Hn-1)+ 1/2p
Fn=1-(1-Fo) / 1+nq(1-Fo)
4 .Homogamie phénotypique positive partielle (HPPP) :
Hn= λ (2pHn-1)/(2p+Hn-1) + 2(1- λ)p(1-p) De même pour le coefficient de correlation gamétique
2pq(1-Fn)= λ 2pq(1-fn-1)/ (1+q(1-Fn-1) +2pq(1- λ )
Pour l’homogamie génotypique ou phénotypique positive le coefficient de
corrélation gamétique est toujours positif et la fréquence génique ne varie pas ; seule la fréquence génotypique varie.
5. Homogamie génotypique négative totale(HGNT) :
Nous supposons que tous les croisements entre individus de même génotypes sont proscrits, tous les autres croisements ayant lieu au hasard. Le couple a
ia
jX a
ka
l .P(a
ia
jX a
ka
l) = f
ijf
kl[(1/ (1-f
ij) +1/(1-f
kl)]
P(a
ia
jX a
ia
j) = 0
Les fréquences et les descendances des trois types de croisements possibles sont les suivants :
AA Aa aa AA x Aa DH[1/(1-D) +1/(1-H)] ½ ½ - AA x aa DR[1/(1-D) +1/(1-R)] - 1 - Aa x aa HR[1/(1-H) +1/(1-R)] - ½ ½ total 1 D1 H1 R1
D1= DH/2[1/(1-D) +1/(1-H)] = ½ DH(1+R)/[(1-D)(1-H)]
H1= DR[1/(1-D) + 1/(1-R)] + H/2[1+D/(1-D)+R/(1-R)] = 1/2+DR(1+H)/2(1-D)(1-R)
R1 = RH/2[1/(1-H) +1/(1-R)]
Fn =1- 1/(1+nq)
si F0=0Hn=2pH
0/(2p+nH
0)
Fn= λ(q+pFn-1)/(1+q(1-Fn-1))
Génétique des populations SV5 chapitre 3 Page 26 6. Homogamie génotypique négative partielle(HGNP) 7. Homogamie phénotypique négative totale (HPNT):
Considérons à nouveau le cas de 2 allèles et 3 génotypes de fréquences D, H et R avec A dominant. Les croisements n’ont lieu qu’entre un individu de phénotypes [A] et un individu de phénotypes [a]. :
AA Aa aa AA x aa DR=D/(D+H) - 1 - Aa x aa HR= H/(D+H) - ½ ½ ____________________________________________________________
1 D1 H1 R1 D1 = 0 H1 = D/(D+H) + H/2(D+H) R1 = H/2(D+H) A la génération 2 : (génération d’équilibre)
D2 = 0 , H2 = ½ et R2 = ½ ainsi après 2 générations la population atteint un équilibre stable.
8. Homogamie phénotypique négative partielle(HPNP)
En conclusion l’homogamie positive élimine les hétérozygotes sans variation de fréquences allèliques. Par contre l’homogamie négative élimine les homozygotes avec variation de fréquences allèliques.
B) consanguinité
La consanguinité est la conséquence de croisements entre individus apparentés c'est-à-dire des croisements entre individus qui possèdent un ou plusieurs ancêtres communs. La consanguinité est un phénomène fréquent chez de nombreuses espèces car elle ne résulte pas uniquement d'un choix délibéré de se croiser avec un apparenté.
Le système de reproduction permet chez certains organismes
hermaphrodites l'autofécondation. C'est un cas extrême de la
consanguinité puisque chaque individu recroise avec lui-même. Ce
phénomène existe chez de nombreuses espèces de plantes comme le
maïs, le blé, le riz, la tomate, le coton, etc. Chez certaines graminées,
l'autofécondation peut dépasser 80%. L'autofécondation n'est
cependant pas le mode exclusif de reproduction et il existe souvent à
Génétique des populations SV5 chapitre 3 Page 27 la fois des croisements autogames et des croisements allogames (entre des individus différents) qui résultent de la mise en place de systèmes d'auto-incompatibilité.
Chez les animaux, l'autofécondation est plus rare. Elle existe chez certains vers parasites, chez des mollusques et divers crustacés.
Le choix d'un croisement avec un apparenté peut s'observer dans certaines populations humaines caractérisées par des structures sociales ou des traditions qui favorisent l'union entre individus apparentés.
1) Consanguinité individuelle et apparentement a)Parenté et consanguinité :
Les notions de parenté et de consanguinité sont centrales pour comprendre le fonctionnement génétique et l'évolution des populations.
Il faut bien distinguer la parenté et la consanguinité:
- deux individus sont apparentés lorsqu'ils ont un ou plusieurs ancêtres communs. - un individu est consanguin lorsqu'il est issu du croisement de deux individus apparentés
Lorsqu'elles sont connues, les relations de parenté sont représentées par un arbre généalogique. La figure 1 représente un mariage entre cousins germains. Dans cette généalogie, seul l'individu M est consanguin car il est issu du croisement de deux individus apparentés (K et L). Ces individus K et L sont apparentés (cousins germains) car ils ont deux de leurs quatre grands-parents en commun (C et D). Il existe beaucoup d'autres individus apparentés dans cette généalogie (H avec C et D; K avec A, B, C, G, H etc.), mais il y a un seul individu consanguin car il n'y a qu'un seul mariage entre apparentés. figure 1
fig.1
Génétique des populations SV5 chapitre 3 Page 28 Le calcul des coefficients de consanguinité et de parenté est basé sur le concept important d'identité des allèles par descendance (on parle aussi d'identité par ascendance) qui fait appel à l'histoire des allèles.
Des allèles sont dits identiques par descendance lorsqu'ils
proviennent de la copie d'un même allèle ancestral sans qu'aucune mutation n'intervienne lors des processus de réplication. Ces allèles ont donc tous comme origine la même séquence d'ADN qui a été dupliquée en de nombreux exemplaires.
Deux allèles identiques par descendance sont donc du même état allélique, mais la réciproque n'est pas vraie. Deux mêmes états alléliques (a1 par exemple) ne sont pas forcément identiques par descendance car ils peuvent provenir de deux événements
mutationnels distincts.
fig.2
b) Coefficient de consanguinité individuel :
On appelle coefficient de consanguinité, noté f la probabilité qu'un individu possède à un locus donné deux allèles identiques par descendance. Ces allèles identiques par descendance proviennent toujours de la copie sans mutation d'un allèle
a1
a1 a1
a1 a1
a2 a2
a2
a2 a1
Allèles dans pop ancestrale
a1a1
a2a2
Autozygotes (homozygotes)
a1a1
a2 a2
a2a2
Allozygotes (homozygotes)
a2 a1a2 Allozygotes
(hétérozygotes) a1