Mécanismes de réparation des dommages de l'ADN

(1)

1

Mécanismes de réparation des dommages de l'ADN

Eric Quéméneur

Objectifs de cet exposé

- Rappels de quelques notions de base avant l'intervention de JC Artus - Introduire les concepts d'instabilité du génome, les mécanismes de maintien

de son intégrité et les bases moléculaires de la cancérogenèse - Situer les enjeux de la recherche en radiobiologie

Plan de cette courte présentation - Dommages de l'ADN

- rappels des bases structurales

- faire la part des choses (dommages radio-induits vs autres) - conséquences fonctionnelles (du dommage au cancer) - Repérer, identifier le dommage

- exemple de MutS (mismatch) - exemple de γ-H2AX (DSB foci)

- Réparer

- réversion directe par la photolyase

- les grandes voies (BER, NER, MR, HR, NHEJ) - maladies génétiques

- Coordonner l'intervention

- articulation Réparation/Cycle celllulaire ("checkpoints")

- Perspectives et enjeux CEA Marcoule

(2)

2

Introduction

On estime que l'ADN d'une cellule humaine moyenne subit plusieurs dizaines de milliers de lésions par cellule et par jour, dans des conditions habituelles d'activité métabolique et d'exposition aux facteurs environnementaux. L'exposition aux rayonnements ionisants n'est qu'un facteur de risque supplémentaire parmi d'autres.

Ces lésions sont globalement néfastes (cancer, vieillissement, etc.) mais la mutagenèse est également un moteur de l'évolution.

Un ensemble très efficace de processus biochimiques identifie, signale et corrige les dommages de l'ADN et contribue ainsi à maintenir l'intégrité du génome cellulaire.

Cette machinerie de "réparation de l'ADN" est toujours active, réactive, finement contrôlée par la cellule et est reliée à plusieurs mécanismes connexes.

Mais cette machinerie n'est pas infaillible ! …la défaillance accroissant le risque cancérogène les facteurs de variabilité sont nombreux : fond génétique individuel, âge, types cellulaires, types de lésions, facteurs environnementaux, etc.

1- Les dommages à l'ADN

(3)

3

Rappels sur la structure de la Chromatine et de l'ADN

La particule coeur (core particle):

146 paires de bases

+ un octamère d’histones 2[H2A, H2B]2et [H3,H4]4

(4)

4

Structure de l'ADN

Rappel sur la structure des protéines

(5)

5

Brochure Environnement-Energie-Santé (2^ndeedition, Juin 1997) SFEN Languedoc-Roussillon

Source type de lésion

Evaluation du nombre de lésions induites par cellule et par jour Température corporelle

(37°C)

Ruptures simples Site apuriniques Sites apyrimidiques Déamination

20 000 - 40 000 10 000

500 100-300

Radicaux libres

Dommages des bases (total) Thymine glycol

Thymidine glycol 5-hydroxométhyluracile 8-hydroxométhylguanosine

Ruptures simples, doubles, pontages

10 000 270

70 620 168

?

Métabolismes divers

Adduits glucose N7-méthylG N3-méthylA O6-méthyl G

Pontages ADN/ADN et ADN/protéines

3 4 000

600 10-3

? Dommages endogènes à l'ADN induits par la vie cellulaire

(6)

6

Source Type de lésions Nombre d'adduits

induits/cellules

Bain de soleil (1 heure) dimères de thymine 60 000 à 80 000

Tabagisme (20 cigarettes/jour) Adduits sur l'ADN

(hydrocarbures polycycliques) 100 à 200 Travailleurs de fours à charbon

(selon les auteurs et le nombre de jours)

BPDE benzo (α)pyryène diol

époxyde 400 à 70 000

Travailleurs de fonderie BPDE benzo (α)pyryène diol

époxyde 300 à 6 500

Bruit de fond des radiations

naturelles (2,4 à 40mSv/an) Ruptures simple brin 2/an Dommages à l'ADN induits par des agents génotoxiques connus

Modification des sucres ND 800-1000

Sites alcali-labiles ND 200-300

Pontages DNA-Protéines ND 150

(DNA-DNA et DNA-RNA cross links)

(7)

7

Effets biologiques des rayonnements

ionisants

Les différentes échelles de temps

Clefs CEA N° 48

Source : Santé, radioactivité et rayonnements ionisants (2003) Brochure du Comité d'Information des Professions de Santé

(8)

8

Mutations intra et interchromosomiques

Décalage de cadre de lecture Mutations ponctuelles (inversion de bases) Différents types de mutations

Comment les mutations causent-elles un cancer ?

La prolifération cellulaire est contrôlée finement par la balance entre 2 classes de protéines : - les suppresseurs de tumeurs (ex. p53, RB1, BRCA1…)

- les (proto)oncogènes (ex. ras, myc, wnt…)

TS PO

Bloque cycle cellulaire Inducteur apoptose Réponse Signaux externes

Maintien intégrité génome Réparation dommages ADN

Stimulation croissance et division cellulaire

Une mutation qui : - inactive un TS fournit un avantage sélectif décisif à la - active un PO cellule concernée

tumorogenèse

Système de réparation des mutations de l'ADN = protection contre la cancer

(9)

9

Du dommage de l'ADN au cancer : un processus probabiliste

Ratio of the probabilities for radiation induced lethal cancer

and the corresponding DSB is

~10^-11~10^-12

Complex adaptative systems at various levels

Risk per humam stem cell per 1 mGy*

* Organism

Tissues

Cells

Molecules

Atoms Ionizing

Radiation ~150 ROS

~2 DNA alterations

~10^-2DNA DSB

~10^-4chromosoma aberr.

~10^-14malignant transformation with fatal outcome

?

~ 10²⁰cells at risk

MAIS, SURTOUT,

LA CELLULE DISPOSE D'UN SYSTEME TRES EFFICACE DE REPARATION DE SON ADN !!

2- Repérer les dommages

(10)

10 Mismatch recognition by MutS Obmolova et al. (2000) Nature 407, 703-710

Crystal structures of mismatch repair protein MutS and its complex with a substrate DNA

Mécanisme de la réparation de mésappariement

le "contrôle qualité" post-replicationnel

(11)

11

La réparation de l’ADN a lieu dans le contexte de la chromatine, les histones jouent également des rôles clefs dans la détection des dommages

Modifications post-traductionnelles des queues des histones

(12)

12

(13)

13 3- Réparer les dommages

(14)

14

Les dommages à l'ADN : mécanismes de réparation

Figure from : Hoeijmakers (2001) Nature 411, 366-374.

Genome maintenance mechanisms for preventing cancer

Mécanisme de la réparation par excision de base (BER),

une tâche de fond pour lutter contre les dommages induits par le métabolisme

(15)

15 Structure des composants de la voie BER

on sait presque tout !?

Mécanismes d'excision de nucléotide ( NER) et de réparation couplée à la transcription -Un système global de surveillance très versatile

Le "reparosome", un complexe stable préformé

Gervais et al. (2004) Nature Struct Mol Biol 11, 616 - 622 (2004) TFIIH contains a PH domain involved in DNA nucleotide excision repair

Schulz et al. (2000) Cell 102, 599–607 Molecular Structure of Human TFIIH TFIIH (460 kDa) = 9 sous-unités

2 entités structurales et fonctionnelles - core : p34, p44, p52, p62, XPB helicase - complexe CAK (CDK-activating kinase) :

Cdk7, cyclin H, MAT1 XPD helicase pontant les deux

(16)

16

Réparation des cassures double-brin (EJ pathway)

synapsis

microhomology alignment

ligation

Ku86/Ku70 DNA-PK_cs Ligase IV XRCC4

trans-

phosphorylationP P

unwinding P P

P

Walker et al. (2001) Nature 412, 607-614 Structure of the Ku heterodimer bound to DNA and its implications for double-strand break repair

(17)

17

Junop et al. (2000) EMBO J. 19, 22, 5962

Crystal structure of the Xrcc4 DNA repair protein and implications for end joining Sibanda et al. (2001) Nature Structural Biology 8, 1015 - 1019

Crystal structure of an Xrcc4–DNA ligase IV complex

Evolution of the structural knowledge on DNA repair systems Database (july 10, 2007) = 44578 entries

Query for "DNA repair" = 778 entries

Sorting for non redondant structures = 494 (<30% ident)

(18)

18

Hoeijmakers (2001) Nature 411, 366-374. Genome maintenance mechanisms for preventing cancer

XP Patient Cockayne patient AT patient

(19)

19 Sensor

DNA damage response and human disease

Signaling

Mediator / Regulator Effector

NHR / HR

Ataxia telangiectasia Fanconi anemia

Nijmegen breakage syndrome Li-Fraumeni

syndrome

Immune deficiency syndromes (inc. SCID)

Familial breast and ovary cancer Bloom's and Werner's

syndromes Sporadic tumors

4- Coordonner l'intervention moléculaire

(20)

20

Les différentes options de la cellule face aux dommages de l'ADN

Les "checkpoints" du cycle cellulaire

(21)

21

(22)

22

Analyse du mécanisme de relocalisation intra-cellulaire de p53

Cartographie fonctionnelle de la protéine

Contrôle Stress ^Contrôle

Stress

Godon et al. (2005) Oncogene 24, 6459-6464. Quantitation of p53 nuclear relocation in response to stress using a yeast functional assay: effects of irradiation and modulation by heavy metal ions.

Un outil génétique d'analyse de la relocalisation de p53

Etude de mutants Etude des stress synergiques

(23)

23

Perspectives - Enjeux des recherches en radiobiologie

Continuer à identifier et caractériser les éléments clés du maintien de l'intégrité du génome Comprendre comment : - ils échappent au contrôle cellulaire

- ils peuvent se maintenir pendant des années - ils peuvent se transmettre

Bases moléculaires de la variabilité individuelle et de la susceptibilité au cancer Faibles doses et synergies avec autres stress cellulaires/facteurs environnementaux

(24)

Génétique des populations Chapitre 1 SV5 Page 2

Génétique des Populations

Chapitre 1 ^: Définition, Objectifs et Applications

La génétique initiée par Gregor Mendel, appelée classiquement g é n é tiq u e m en d él i en n e , a pour objectif de comprendre le déterminisme et la transmission des caractères par l'analyse de la descendance d'un croisement contrôlé entre individus de génotypes différents.

Après la découverte du support de l'information génétique (ADN), la g é n é tiq u e mo lé c ul ai r e continue à rechercher les mécanismes fins du déterminisme, de l'expression et de la transmission des caractères.

La compréhension du déterminisme et de la transmission des caractères doit aussi étudier les individus dans les conditions naturelles où ils sont génétiquement uniques et libres de se reproduire avec n'importe quel autre individu de la même espèce.

Cette partie de la génétique, qui considère les individus en interactions avec leur environnement, est l a g én é t iqu e d es po pu l at io n s .

A) Définitions et objectifs

La génétique des populations étudie la variabilité génétique présente dans et entre les populations avec 3 principaux objectifs : 1 - me su r er la va ri a bi li té g é n ét iqu e , app el ée au ss i d iv er si té g é nét iq ue , pa r la fr é qu en ce d es d i ffé r en t s a l lè le s d’ un mê me gè n e.

2 - c o mpr e nd re c omm e nt l a v a ri a bi li té gé n é tiq ue se

t r an sm et d 'une gé n ér at io n à l 'a ut r e

(25)

Génétique des populations Chapitre 1 SV5 Page 3

3 - c omp re nd re com me n t et pou rquo i l a v ar ia bi li té g é n ét iqu e évo lu e au fi l d es gé n é ra tio ns .

Si la génétique mendélienne se base sur des croisements contrôlés par un expérimentateur, la génétique des populations étudie les proportions des génotypes au sein d'un ensemble d'individus issus de croisements non contrôlés entre de nombreux parents. C'est donc une application des principes de base de la génétique mendélienne à l'échelle des populations fig.1.

fig.1

B ) Qu'appelle-t-on population ?

Une population est l'ensemble des individus de la même espèce qui ont la possibilité d'interagir entre eux au moment de la reproduction.

Exemples :- Eléphants d’un parc national africain -Les chênes d’une zone forestière

-Les individus d’une espèce de parasite intestinal, présent chez un seul individu hôte

II-Variabilité génétique dans les populations naturelles

Une particularité du monde vivant est la variabilité des phénotypes

individuels. A l'intérieur d'une espèce, il n'existe pas 2 individus

(26)

Génétique des populations Chapitre 1 SV5 Page 4

ayant exactement les mêmes caractéristiques phénotypiques:

l'individu est unique. Certaines de ces variations s'expriment au niveau phénotypique (morphologie, physiologie, comportement, etc.) mais les autres restent "cachées" et leur mise en évidence nécessite l'utilisation de techniques adaptées (variabilité des protéines ou des séquences d'ADN).

Les variations du phénotype (P) sont dues pour une partie à des facteurs environnementaux (E) (alimentation, climat, interactions avec les autres espèces, etc.) et pour d’autre partie à des différences entre les génotypes individuels, transmissibles à la descendance (G) cette partie sera développer en génétique quantitative.

A ) Déterminisme des variations : notion de polymorphisme La génétique des populations s'intéresse principalement à la variabilité d'origine génétique présente dans les populations et que l'on désigne sous le nom de polymorphisme. (couleur, forme, d'ADN présente une variation de séquence correspondant à plusieurs formes alléliques, etc)

Par opposition, on appelle monomorphes les gènes qui ne présentent pas de variabilité (un seul allèle présent dans la population).

1) Déterminisme épigénétique

Lorsque la variabilité d'un caractère n'a aucune base génétique, c'est à dire ne fait pas intervenir de modification de séquence d'ADN, elle est qualifiée de variabilité épigénétique. Cette variabilité résulte souvent de l'action des facteurs environnementaux sur l'expression phénotypique d'un caractère (température, alimentation, physico- chimie de l'environnement, etc.).

2 ) Déterminisme génétique

La variabilité d'un caractère est déterminée génétiquement

lorsqu'elle est due, au moins en partie, à la présence de plusieurs

formes alléliques dans la population.

(27)

Génétique des populations Chapitre 1 SV5 Page 5

Dans certains cas, la variabilité phénotypique est due à la variation d'un seul gène = déterminisme monogénique. Cela ne veut pas dire que le caractère est contrôlé par un seul gène mais que la variation d'un seul de ces gènes est suffisante pour entraîner une variation phénotypique. On parle alors de caractères mendéliens. Chez l'homme, environ 5000 caractères mendéliens sont connus.

Dans d'autres cas, la variabilité d'un caractère est déterminée par un grand nombre de gènes ayant chacun plusieurs allèles. On parle de déterminisme polygénique. C'est le cas de tous les caractères quantitatifs qui font l'objet d'une mesure comme la taille, le ^poids, etc. L'analyse génétique de ces caractères relève de la génétique quantitative qui sépare les effets des gènes en effets additifs A, effets de dominance D, effet d'épistasie ou d'interaction entre gènes I:

G = A + D + I

B) Étendue et méthodes d'étude de la variabilité

Historiquement, la recherche des variations génétiques dans les populations naturelles a concerné des caractères directement accessibles à l'observateur (morphologie, couleur, etc). Le développement des techniques de biochimie, cytogénétique et de biologie moléculaire ont permis d'étudier la variabilité génétique à des échelles plus fines, jusqu'au niveau de la séquence d'ADN, permettant même l'étude du polymorphisme des régions non codantes.

1) Polymorphisme morphologique

C'est le polymorphisme de taille, de forme, de couleur etc. La variabilité génétique de la couleur de certaines espèces, appelée polychromatisme, est certainement l'un des polymorphisme qui a été le plus étudié. Un exemple célèbre est la variation de la couleur et de l'ornementation de la coquille de l'escargot du genre Cepaea. En un même endroit coexistent plusieurs formes phénotypiques

déterminées par plusieurs gènes polymorphes: des escargots à

coquille rose, jaune ou brune, et des escargots sans bande et avec

bandes dont le nombre varie entre 1 et 5. Figure 2

(28)

Génétique des populations Chapitre 1 SV5 Page 6

Fig.2 2) Polymorphisme des protéines

a)Polymorphisme enzymatique

Depuis les années 1960, la variabilité des protéines est étudiée par électrophorèse. Les protéines sont des molécules chargées qui se déplacent dans un support poreux (gel d’agarose, d’amidon, de

polyacrylamide, d'acétate de cellulose) lorsqu’elle celui-ci est soumis à un champ électrique. Figure 3

Fig.3

La vitesse de migration dépend de la charge globale de la protéine,

de sa taille et de sa conformation. Toute mutation dans la séquence

d'un gène codant pour une protéine peut modifier le sens d'un codon,

altérer la séquence d'acides aminés donc la charge électrique de la

protéine et sa vitesse de migration. Ce changement de structure

primaire peut être détecté par électrophorèse qui sépare les

(29)

Génétique des populations Chapitre 1 SV5 Page 7

variants protéiques ayant des vitesses de migration différentes appelées souvent F (fast) et S (slow).

La mise en évidence de différents allèles d'un même gène est possible pour les enzymes grâce à la spécificité de la réaction enzyme-substrat visualisée par une réaction colorée. L'existence de variations génétiques à un locus donné est détectée par la présence de différents niveaux de migration dans le gel d'électrophorèse, qui sont associés à des allèles différents appelés allozymes. fig.4

Fig.4

Représentation schématique d'un gel d'électrophorèse pour différents systèmes génétiques :

a) cas d'une protéine monomérique codée par un gène à deux allèles (F = Fast et S = Slow);

b) cas d'une protéine monomérique codée par un gène à trois allèles (V = very Fast, F = Fast et S = Slow);

c) cas d'une protéine dimérique codée par un gène à deux allèles (F = Fast et S = Slow) ou les hétérozygotes sont représentés par 3 bandes.fig.5

Fig.5

(30)

Génétique des populations Chapitre 1 SV5 Page 8

b) Polymorphisme immunologique

La variabilité de certaines protéines peut être étudiée par des techniques d'immunologie. Classiquement, il s'agit de mesurer la spécificité et l’affinité des réactions antigènes-anticorps lorsque l'on fait réagir un anticorps, produit contre un antigène défini, avec des antigènes d’origines variées (hétérologues).

Chez l’homme, le polymorphisme immunologique le plus étudié est celui des antigènes présents à la surface des globules rouges dont les plus connus sont le système ABO, le système rhésus (allèle Rh+ dominant sur Rh

^–

), le système MN (M et N codominants).

Pour le système ABO, les allèles A et B sont codominants entre eux et tous les deux dominants sur l'allèle O ce qui donne la typologie antigènes/anticorps suivante :

Groupe

OO Anti B, anti A Donneur universel

De fortes variations géographiques existent pour les fréquences des allèles du

système ABO à l'échelle des continents.fig6

(31)

Génétique des populations Chapitre 1 SV5 Page 9

Fig .6 3) Polymorphisme chromosomique

Ce polymorphisme peut être dû soit à une variation du nombre des chromosomes (euploïdie, aneuploïdie) soit à un changement de leur structure (délétion, duplication, inversion, translocation). Par exemple, chez une graminée Dactylis glomerata , il existe plusieurs catégories d'individus, certains étant diploïdes c'est-à-dire ayant 2N chromosomes, d'autre tétraploïdes à 4N chromosomes.fig.7

Fig.7

Un autre exemple de polymorphisme chromosomique bien connu est

celui des inversions chromosomiques observées chez la drosophile

américaine Drosophila pseudoobscura . De très nombreuses inversions

différentes ont été observées chez cette espèce de Drosophile.

(32)

Génétique des populations Chapitre 1 SV5 Page 10

fig.8 4) Polymorphisme de l'ADN

Les techniques issues de la biologie moléculaire permettent de rechercher des variations dans les séquences nucléotidiques de l'ADN et sont de plus en plus utilisées pour étudier le fonctionnement génétique des populations.

Parmi l'ensemble des techniques disponibles, il faut distinguer celles qui permettent de mettre en évidence une variabilité dispersée dans tout le génome. Les marqueurs révélés sont alors multi locus et dominants.

D'autres techniques permettent de révéler une variabilité à des endroits plus limités du génome. Les marqueurs sont souvent qualifiés de mono locus et souvent codominants.

Il faut également distinguer parmi ces techniques celles qui nécessitent uniquement une extraction de l'ADN des individus étudiés de celles qui nécessitent une amplification in vitro d'une portion définie d'ADN par PCR (polymerase chain reaction).

Exemple de marqueurs moléculaires utilisés en génétique des populations : Polymorphisme RFLP (Restriction fragment Length Polymorphism) et PCR-RFPL.

Figure 9

(33)

Génétique des populations Chapitre 1 SV5 Page 11

Fig.9

C) Mesure de la diversité génétique

Fréquences alléliques et fréquences génotypiques

Lorsqu'une population est polymorphe pour un caractère donné, il est possible de calculer la fréquence des phénotypes observés.

Par exemple dans une population de N individus dont Nn ont le corps noir et Nb le corps blanc, les fréquences phénotypiques de la population pour le caractère couleur du corps sont les suivantes : fréquence du phénotype noir f[n] = Nn/N

fréquence du phénotype blanc f[b] = Nb/N

Si ce caractère est gouverné par un gène à deux allèles A et a autosomaux, avec a récessif responsable de la couleur blanche, les génotypes AA et Aa correspondent au phénotype noir et le génotype aa au phénotype blanc. Les fréquences phénotypiques permettent alors uniquement de connaître la fréquence du génotype aa puisque parmi les individus noirs, on ne peut pas distinguer les génotypes AA des génotypes Aa . La fréquence des allèles A et a ne peut également pas être calculée.

Si la couleur du corps des individus présente non plus 2 mais 3 phénotypes (noir, jaune et blanc) gouvernés par un couple d'allèles A

1

et A

2

autosomaux et codominants, les trois génotypes possibles A

1

A

1

,

) = Nb/N = R Ainsi, pour un locus donné, une population est complètement décrite si l'on connaît la fréquence de chacune des catégories génétiques.

)/2N avec p + q = 1

Autrement dit si D et R sont les fréquences des homozygotes AA et aa , H la fréquence des hétérozygotes Aa , les fréquences alléliques peuvent aussi être calculées à partir des fréquences génotypiques : f( A ) = p = D + H/2

f( a ) = q = R + H/2

Ces fréquences p et q représentent également une estimation de la

probabilité qu'un gamète mâle ou femelle porte l'allèle A ou l'allèle a .

(35)

Génétique des populations Chapitre 1 SV5 Page 13

Il est important de noter que les fréquences alléliques comportent moins d'information que les fréquences génotypiques car on perd la manière dont les allèles sont associés 2 à 2 dans les génotypes individuels.

Exemple : du groupe sanguin MN chez l'homme L’examen de 730 aborigènes australiens a donné les résultats suivants :

Groupe sanguin Génotype Nombre Fréquence

[M] MM 22 0.03

[MN] MN 216 0.30

[N] NN 492 0.67

Les fréquences alléliques calculées par les deux méthodes sont les suivantes:

(36)

Génétique des populations SV5 chapitre 2 Page 15

CHAPITRE 2 : Équilibre de Hardy Weinberg

Dans un cas simple appelé p o p u l a t i o n t h é o r i q u e i d é a l e , qui se définit par les caractéristiques suivantes :

1) population d'organismes d i p l o ï d e s à r e p r o d u c t i o n s e x u é e et à g é n é r a t i o n s n o n c h e v a u c h a n t e s (aucun croisement entre individus de générations suivantes)

2) population d'e f f e c t i f i n f i n i où les croisements sont entièrement a l é a t o i r e s

3) p o p u l a t i o n c l o s e génétiquement (absence de flux migratoires)

4) tous les individus, quel que soit leur génotype, ont la même capacité à se reproduire et à engendrer une descendance viable = absence de sélection 5) A b s e n c e d e m u t a t i o n et de distorsion de ségrégation méïotique (un individu Aa produira toujours 50% de gamètes A et 50% de gamètes a).

Parmi toutes ces caractéristiques, le croisement au hasard des individus, appelé système de r e p r o d u c t i o n p a n m i c t i q u e , est l'hypothèse la plus importante. Cette hypothèse suppose que les individus ne choisissent pas leur partenaire sexuel ni en fonction de leur génotype, ni en fonction de leur phénotype = p a n m i x i e et que la rencontre des gamètes se fait au hasard = p a n g a m i e .

A - CONSTITUTION GENETIQUE DES POPULATIONS

1- Définitions :

Pour définir la constitution génétique d'une population plusieurs niveaux, phénotypique, génotypique et génique sont utilisés. Ils sont décrits par une loi de probabilité. Ainsi pour une variable donnée (le caractère: couleur des yeux) on précisera les différents états possibles (bleu, vert, marron ...) et les probabilités avec lesquelles ces états se rencontrent dans la population étudiée (0,10 ; 0,20 ; 0,60 ...). Ce premier descripteur est la constitution phénotypique de la population.

2- Exemples d'Estimation de constitutions génétiques

2.1 Cas de gènes autosomiques

Soit une population de N individus diploïdes à reproduction sexuée biparentale, étudiée pour un caractère à déterminisme monogénique. On y observe trois classes

(37)

Génétique des populations SV5 chapitre 2 Page 16 génotypiques d'effectifs respectifs (A1A1) n1, (A1A2) n2, (A2A2) n3, avec n1 + n2 + n3 = N. Le déterminisme génétique étant connu, un couple d'allèles autosomiques A1, A2 codominants, la constitution génotypique de la population correspond à sa constitution phénotypique. Les fréquences génotypiques sont alors exactement définies par les rapports :

freq (A1A1) = f1 = D = n1/N freq (A1A2) = f2 = H = n2/N freq (A2A2) = f3 = R = n3/N

p = (2n1 + n2)/2N = D + 1/2 H q = (2n3 + n2)/2N = R + 1/2 H.

2.2 Cas de gènes liés au sexe (ou de gènes d'un système haplo-diploïde) : Soit A1 et A2 des allèles situés sur l'hétérochromosome commun aux deux sexes.

Dans une population où l'on dénombre N1 individus de sexe homogamétique et N2 de sexe hétérogamétique, le nombre de gènes concernés est de 2N1 + N2. Notons n1, n2, n3, les effectifs des génotypes A1A1, A1A2, A2A2 chez les femelles, et m1 et m2 ceux des génotypes A1 et A2 chez les mâles. En considérant chaque groupe sexuel comme un échantillon indépendant, on peut estimer la fréquence de l'allèle A1 pour chacun des sexes et pour l'ensemble de la population :

p= (2n1 + n2)/2N1 p’ = m1/ N2 P = (2n1 + n2 + m1)/(2N1 + N2) (femelles) (mâles) (l’ensemble de la population)

B- DEFINITION DU MODELE DE HARDY-WEINBERG

1 - L'Hypothèse panmictique :

1.1 CAS DE GENES AUTOSOMIQUES 1. 1. 1 RENCONTRE DES GAMETES

Lorsque la rencontre des gamètes se fait au hasard, on dit qu'il y a pangamie;

lorsque la rencontre des individus se fait au hasard, ont dit qu'il y a panmixie.

Dans l'hypothèse panmictique, chaque nouveau zygote formé résulte de deux tirages au sort indépendants, l'un dans l'urne des ovules, l'autre dans l'urne des spermatozoïdes. Ces urnes sont respectivement composées de l'ensemble des ovules matures fournis par les femelles de la population au moment du tirage et de l'ensemble des spermatozoïdes matures fournis par les mâles de la population au moment du tirage. Les probabilités de chaque nouveau zygote sont donc : A1A1 = p² A1A2 = 2pq A2A2 = q².

On retrouve la relation : (p +q)² = p²+ 2pq + q² = 1,

1.1.2 RENCONTRE BASE SUR LES CROISEMENTS DES INDIVIDUS

(38)

Génétique des populations SV5 chapitre 2 Page 17 Considérons le cas d’un locus avec deux allèles et une population infinie où les fréquences des trois génotypes ont des valeurs quelconques à la génération n.

Génotypes et fréquences des mâles A1A1 A1A2 A2A2 D H R ________________________________

Génotypes A1A1 D D² DH DR et fréquences A1A2 H DH H² HR des femelles A2A2 R DR HR R²

A1A1 A1A2 A2A2 A1A1 x A1A1 D² 1 - - A1A1 x A1A2 2DH 1/2 1/2 - A1A1 x A2A2 2DR - 1 - A1A2 x A1A2 H2 1/4 1/2 1/4

A1A2 x A2A2 2RH - 1/2 1/2 A2A2 x A2A2 R² - - 1

total 1 D1 H1 R1 D1 = D² + 1/2(2DH) +1/4(H²) = p²

H1= 1/2(2DH) + (2DR) + 1/2H² +1/2(2RH) = 2(D+1/2H)(R+1/2H) = 2pq R1 = R² +1/2(2RH) + 1/4 H² = q²

La structure génotypique restera identique au cours des générations ultérieurs puisque les proportions D, H et R ne dépendent que de p et q .

2. Cas d'un locus situé sur un hétérochromosome (et gènes d'un système haplo-diploïde)

Lorsqu'un gène est situé sur un hétérochromosome, le sexe homogamétique possède deux locus et le sexe hétérogamétique un seul.

Si les deux sexes sont en nombre égal dans la population, 2/3 des allèles liés au sexe seront portés par le sexe homogamétique(p) et 1/3 par l'autre sexe(p’). Pour un taux sexuel différent, il suffit de pondérer les proportions par les effectifs de chaque sexe.

P=2/3p + 1/3p’

2.1 CONSTITUTIONS GENETIQUES A L'ETAT D'EQUILIBRE femelles mâles

A1 A1 A1 A2 A2 A2 A1 A2 p2 2 p q q2 p’ q’

La fréquence de l'allèle A1 est égale à p=p’ dans chaque sexe, elle restera inchangée dans les deux sexes après une génération en reproduction panmictique. Le même

(39)

Génétique des populations SV5 chapitre 2 Page 18 raisonnement est vrai quel que soit le numéro d'ordre de la génération. Nous sommes en présence d'un état d'équilibre.

2.2 L'ATTEINTE DE L'ETAT D'EQUILIBRE

Même si la fréquence allélique n'est pas identique dans les deux sexes, il est évident que, sous les hypothèses de la loi de Hardy-Weinberg, la fréquence allélique pour l'ensemble de la population ne variera pas puisque aucun facteur évolutif n'agira. Par contre, nous allons montrer que la distribution des fréquences alléliques, dans chaque sexe, varie en oscillant, tout en se rapprochant de la position d'équilibre.

(40)

Génétique des populations SV5 chapitre 2 Page 19 [(pA + pa)2 (pB +pb)2] .

Il existe quatre types de gamètes possibles : AB, Ab, aB et ab, de fréquences respectives pApB, pApb, papB et papb. On donne souvent le nom d'haplotype à ces combinaisons gamétiques: par exemple haplotype AB. Si les gènes considérés sont associés au hasard dans les gamètes, la fréquence de chaque haplotype sera simplement égale au produit des fréquences des allèles respectifs qui le constitue.

Dans ce cas la population est à l'état d'équilibre de Hardy-Weinberg et on dit à l’équilibre d'association gamétique ou simplement équilibre d'association. On emploie parfois le terme d'équilibre de liaison (linkage equilibrium). Cette appellation n'est cependant pas très appropriée dans la mesure où elle laisse croire qu'il s'agit de gènes physiquement liés. En fait le raisonnement est valable pour tous les locus. Les états d'équilibre des différentes constitutions génétiques seront identiques, que les locus soient physiquement liés ou non. Comme nous le démontrerons, seule la vitesse d'atteinte de l'état d'équilibre dépend du pourcentage de recombinaison.

Si à une génération donnée l'association aléatoire des allèles n'est pas réalisée lors de la formation des gamètes, certains haplotypes présenteront des fréquences supérieures, ou inférieures, à celles attendues à l'équilibre. La population n'est donc pas à l'état d'équilibre. Pour l'haplotype AB on peut alors écrire :

AB = pApB + D,

où D est une valeur relative qui représente le déséquilibre d'association gamétique (dit aussi, mais de façon moins correcte, déséquilibre de liaison ou "linkage disequilibrium"). Les fréquences des autres haplotypes seront modifiées avec la même valeur absolue. En effet, si la fréquence d'association des allèles est modifiée, les fréquences alléliques, elles, ne le sont pas, car la population est toujours régie par le principe de Hardy-Weinberg. La somme des fréquences des haplotypes AB et Ab par exemple, qui regroupent tous les allèles A, doit être égale à pA. Ceci implique que la fréquence des haplotypes Ab soit :

Ab = pApb - D.

Dans ces conditions D est différent de zéro et la population est effectivement en déséquilibre d'association gamétique. Les fréquences gamétiques réelles, fonctions des fréquences à l'équilibre et de D (Lewontin et Kojima, 1960, Evolution 14:458), s'écrivent :

AB = pApB + D et D=AB - pApB Ab = pApb - D aB = papB - D ab = papb + D, On en déduit alors : D = AB.ab – aB.Ab.

2 - L'approche de l'état d'équilibre

L'atteinte de l'état d'équilibre est fonction du degré de recombinaison entre les locus (génétiquement indépendants: c=0.5, ou non indépendants: c < 0,5).

(41)

Génétique des populations SV5 chapitre 2 Page 20 Pour démontrer que la constitution gamétique de la population tend vers un état d'équilibre, il convient d'établir les relations de récurrence des fréquences gamétiques entre deux générations successives. Raisonnons sur la fréquence des gamètes AB. Un gamète AB peut être obtenu de deux façons exclusives. S'il est produit sans recombinaison (probabilité 1 - c), sa probabilité d'être AB est égale à la fréquence des AB de la génération précédente, soit AB(n-1). S'il est produit par recombinaison (probabilité c), les deux gènes A et B proviendront de parents différents (probabilité pApB). En effet, sous l'hypothèse panmictique, la probabilité de tirer A et B est simplement le produit pApB, puisque ces allèles sont tirés au hasard dans l'urne gamétique de chaque parent. Sous les hypothèses de la loi de Hardy-Weinberg ceci reste vrai quelle que soit la génération considérée, les fréquences alléliques de chacun des locus étant constantes.

La probabilité totale d'obtention d'un gamète AB s'écrit donc : AB(n) = (1 - c) AB(n-1) + c pApB

En retranchant pApB à chacun des deux membres on obtient :

C’est-à-dire : Dn = (1 - c) Dn-1

Cette relation étant valable à chaque génération, on obtient finalement :

D₀est le déséquilibre d'association gamétique dans la population initiale. (1-c) <1, (1-c)n tend vers zéro lorsque n augmente, et donc Dn tend vers zéro. Le raisonnement s'applique de la même manière pour les autres types de gamètes et la population tend vers l'état d'équilibre d'association gamétique.

Exemple :

Pour illustrer la façon dont une population tend vers l’équilibre, considérons la fusion de 2 populations d’effectifs égaux et toutes les homozygotes pour les 2 locis considérés.

AABB (1/2) aabb (1/2) 1) à la génération initiale Go :

les gamètes sont AB (1/2) ab(1/2) les fréquences allèliques sont : pA=1/2 pB= 1/2 pa=1/2 pb=1/2 et Do= AB-pApB=1/4

2) à la génération suivante G1 :

après un cycle de reproduction panmictique les génotypes des individus sont :

AABB 1/4 AaBb 1/2 aabb 1/4 AB = ab =3/8 Ab= aB=1/8 3) à la génération Gn :

ABⁿ = pApB+ (1-c)ⁿ(AB^o-pApB)=1/4+(1/2)ⁿ(1/2-1/4) = 1/4(1+1/2ⁿ) Dn = (1-c)ⁿDo = (1/2)ⁿ1/4

N.B Les deux loci sont considérés indépendants

AB(n) - pApB = (1 - c)[ AB(n-1) – pApB]

Dn = (1- c)ⁿD0

(42)

Génétique des populations SV5 chapitre 3 Page 21

Chapitre 3 : Croisements non panmictiques

Homogamie et consanguinité

Chez de nombreuses espèces, les croisements ne se réalisent pas au hasard. L'hypothèse de panmixie n'étant pas respectée, la structure génétique des populations va s'écarter de celle d'une population théorique idéale. Ces croisements non aléatoires des individus d'une population peuvent soit correspondre à des appariements plus fréquents entre individus de phénotypes ou de génotypes déterminés

= homogamie (assortative mating), soit être la conséquence de croisements entre individus apparentés = consanguinité. Ces deux cas doivent être distingués car ils n'ont pas les mêmes conséquences sur la structure génétique des populations.

A) Homogamie 1) Définition

L'homogamie correspond des croisements entre phénotypes ou génotypes particuliers qui sont plus fréquents que ceux attendus sous l'hypothèse de panmixie. L'homogamie peut résulter d'un choix des conjoints sur la base de leur ressemblance ou dissemblance phénotypique. Le choix des partenaires peut impliquer des critères morphologiques, comportementaux ou sociaux. L'homogamie est généralement positive car elle implique souvent des croisements entre individus phénotypiquement semblables. Cependant, dans certains cas, des croisements plus fréquents se réalisent entre individus de phénotypes (ou de génotypes) différents (homogamie négative). L'homogamie peut être totale ou partielle si tout ou seulement une partie des couples se forment sur la base d'un choix.

Les conséquences de l'homogamie sur la structure génétique des populations se traduiront par une modification de la fréquence des génotypes pour les caractères impliqués dans l'appariement sans que les fréquences alléliques à ces loci soient modifiées. Les fréquences génotypiques de tous les autres loci seront modifiées.

Cette modification des fréquences génotypiques est facilement

prévisible dans le cas de :

(43)

Génétique des populations SV5 chapitre 3 Page 22 2) l'homogamie génotypique positive totale (HGPT) :

Où chaque individu d'un génotype donné se croise avec un individu de même génotype.

AA Aa aa AA x AA Dn-1 1 - - Aa x Aa Hn-1 ¼ ½ ¼ aa x aa Rn-1 - - 1

_________________________________________________

Total 1 Dn Hn Rn

- les génotypes AA se croisent entre eux et produisent 100% de AA - les génotypes aa se croisent entre eux et produisent 100% de aa - les génotypes Aa se croisent entre eux et produisent 1/4

d'individus AA, 1/4 d'individus aa et 1/2 d'individus Aa.

Ainsi, à chaque génération, la fréquence des homozygotes augmente alors que celle des hétérozygotes diminue de moitié.

L'évolution des fréquences génotypiques est alors donnée par les formules de récurrence suivantes où n représente la génération et les fréquences des génotypes AA, Aa et aa sont respectivement D, H et R :

= q Cette évolution atteint rapidement un équilibre avec une absence totale d'hétérozygotes. La population sera composée uniquement d'homozygotes AA en proportion p et d'homozygotes aa en

proportion de q.

Si, l'homogamie n'est pas totale, la population atteindra un état d'équilibre où les hétérozygotes seront présents mais à un taux plus faible que si les croisements se réalisaient au hasard. Si l'homogamie est négative, les croisements se font préférentiellement entre

individus de génotypes différents ce qui a pour conséquence

(44)

Génétique des populations SV5 chapitre 3 Page 23 d'augmenter la proportion des hétérozygotes qui se maintiennent à un taux plus élevé que si la population suivait le modèle panmictique.

Coefficient de corrélation gamétique :

Considérons un couple de gènes autosomal A et a de fréquence p et q. supposons que le cycle est non panmictique : la structure génotypique à la génération n sera :

pq

))

1-F

_n+1

=1/2 (1-F

_n

) F

_n+1

= 1/2(1+F

_n

)

pour F

0

= 0 :

Exemples :

3) . Homogamie génotypique positive partielle (HGPP) :

Considérons une population dont le polymorphisme est

conditionné par un locus autosomal A-a avec (1 - λ) se reproduisant

par panmixie et λ se reproduisant en régime d’homogamie

(45)

Génétique des populations SV5 chapitre 3 Page 24 génotypique positive absolue. La fréquence des hétérozygotes à la génération n est :

La résolution de cette équation de récurrence permet de connaître l’évolution de la population au cours des générations successives en supposant que le système de reproduction ne varie pas :

Si n tend vers une génération infinie Hn = He = 4(1- λ)pq/(2- λ).

On peut exprimer Fn en fonction λ de n et de Fo :

1-Fn =( λ /2)(1-Fn) +(1- λ )

4-Homogamie phénotypique positive totale (HPPT) :

Nous supposons qu’au locus considéré l’un des allèles soit A est dominant sur l’autre :donc au point de vue du choix du conjoint, les homozygotes AA et aa se comporte exactement de la même manière. tous les individus de phénotype [A] se croisent entre eux et représentent une proportion de (1-R) et tous les non [A]

entre eux dans une proportion [R].les différents types de croisements sont : AA Aa aa

AA x AA D²/ (1-R) 1 - - AA x Aa 2DH/ (1-R) 1 /2 1/2 - Aa x Aa H²/ (1-R) 1/4 1/2 1/4 aa x aa R - - 1 1 D1 H1 R1

La génération suivante :

D1= D²/(1-R) + 1/2 [2DH²/(1-R)] + 1/4 [H²/(1-R)] = (D+1/2H)²/(1-R) = 2p²/(2p+H)

H1= H(D+1/2H)²/(1-R) = 2pH/(2p+H) R1= R+1/4H²/(1-R) = 1-D

1

-H

1

Les conséquences de tels mariages peuvent être plus clairement mises en évidence par la résolution de l’équation de recurrence pour la proportion des hétérozygotes.

Hn = λ(Hn-1)/2 + (1- λ) 2pq

Hn = 4(1- λ)pq/(2- λ) + (λ/2)

ⁿ

[Ho – 4(1- λ)pq/(2- λ)]

Fn = λ/(2- λ) +( λ/2)

ⁿ

[Fo- λ/(2- λ)]

(46)

Génétique des populations SV5 chapitre 3 Page 25 Hn = (2pHn-1)/(2p+Hn-1)

1/Hn = 1/Hn- ¹ + 1/2p

On peut exprimer Fn en fonction de n : 1/Hn = 1/(Hn-1)+ 1/2p

Fn=1-(1-Fo) / 1+nq(1-Fo)

4 .Homogamie phénotypique positive partielle (HPPP) :

Hn= λ (2pHn-1)/(2p+Hn-1) + 2(1- λ)p(1-p) De même pour le coefficient de correlation gamétique

2pq(1-Fn)= λ 2pq(1-fn-1)/ (1+q(1-Fn-1) +2pq(1- λ )

Pour l’homogamie génotypique ou phénotypique positive le coefficient de

) +1/(1-f

kl

)]

P(a

i

a

j

X a

i

a

j

) = 0

Les fréquences et les descendances des trois types de croisements possibles sont les suivants :

AA Aa aa AA x Aa DH[1/(1-D) +1/(1-H)] ½ ½ - AA x aa DR[1/(1-D) +1/(1-R)] - 1 - Aa x aa HR[1/(1-H) +1/(1-R)] - ½ ½ total 1 D1 H1 R1

D1= DH/2[1/(1-D) +1/(1-H)] = ½ DH(1+R)/[(1-D)(1-H)]

H1= DR[1/(1-D) + 1/(1-R)] + H/2[1+D/(1-D)+R/(1-R)] = 1/2+DR(1+H)/2(1-D)(1-R)

R1 = RH/2[1/(1-H) +1/(1-R)]

Fn =1- 1/(1+nq)

^{si F}⁰⁼⁰

Hn=2pH

0

/(2p+nH

0

)

Fn= λ(q+pFn-1)/(1+q(1-Fn-1))

(47)

Génétique des populations SV5 chapitre 3 Page 26 6. Homogamie génotypique négative partielle(HGNP) 7. Homogamie phénotypique négative totale (HPNT):

Considérons à nouveau le cas de 2 allèles et 3 génotypes de fréquences D, H et R avec A dominant. Les croisements n’ont lieu qu’entre un individu de phénotypes [A] et un individu de phénotypes [a]. :

AA Aa aa AA x aa DR=D/(D+H) - 1 - Aa x aa HR= H/(D+H) - ½ ½ ____________________________________________________________

1 D1 H1 R1 D1 = 0 H1 = D/(D+H) + H/2(D+H) R1 = H/2(D+H) A la génération 2 : (génération d’équilibre)

D2 = 0 , H2 = ½ et R2 = ½ ainsi après 2 générations la population atteint un équilibre stable.

8. Homogamie phénotypique négative partielle(HPNP)

En conclusion l’homogamie positive élimine les hétérozygotes sans variation de fréquences allèliques. Par contre l’homogamie négative élimine les homozygotes avec variation de fréquences allèliques.

B) consanguinité

La consanguinité est la conséquence de croisements entre individus apparentés c'est-à-dire des croisements entre individus qui possèdent un ou plusieurs ancêtres communs. La consanguinité est un phénomène fréquent chez de nombreuses espèces car elle ne résulte pas uniquement d'un choix délibéré de se croiser avec un apparenté.

Le système de reproduction permet chez certains organismes

hermaphrodites l'autofécondation. C'est un cas extrême de la

consanguinité puisque chaque individu recroise avec lui-même. Ce

phénomène existe chez de nombreuses espèces de plantes comme le

maïs, le blé, le riz, la tomate, le coton, etc. Chez certaines graminées,

l'autofécondation peut dépasser 80%. L'autofécondation n'est

cependant pas le mode exclusif de reproduction et il existe souvent à

(48)

Génétique des populations SV5 chapitre 3 Page 27 la fois des croisements autogames et des croisements allogames (entre des individus différents) qui résultent de la mise en place de systèmes d'auto-incompatibilité.

Chez les animaux, l'autofécondation est plus rare. Elle existe chez certains vers parasites, chez des mollusques et divers crustacés.

Le choix d'un croisement avec un apparenté peut s'observer dans certaines populations humaines caractérisées par des structures sociales ou des traditions qui favorisent l'union entre individus apparentés.

1) Consanguinité individuelle et apparentement a)Parenté et consanguinité :

Les notions de parenté et de consanguinité sont centrales pour comprendre le fonctionnement génétique et l'évolution des populations.

Il faut bien distinguer la parenté et la consanguinité:

- deux individus sont apparentés lorsqu'ils ont un ou plusieurs ancêtres communs. - un individu est consanguin lorsqu'il est issu du croisement de deux individus apparentés

Lorsqu'elles sont connues, les relations de parenté sont représentées par un arbre généalogique. La figure 1 représente un mariage entre cousins germains. Dans cette généalogie, seul l'individu M est consanguin car il est issu du croisement de deux individus apparentés (K et L). Ces individus K et L sont apparentés (cousins germains) car ils ont deux de leurs quatre grands-parents en commun (C et D). Il existe beaucoup d'autres individus apparentés dans cette généalogie (H avec C et D; K avec A, B, C, G, H etc.), mais il y a un seul individu consanguin car il n'y a qu'un seul mariage entre apparentés. figure 1

fig.1

(49)

Génétique des populations SV5 chapitre 3 Page 28 Le calcul des coefficients de consanguinité et de parenté est basé sur le concept important d'identité des allèles par descendance (on parle aussi d'identité par ascendance) qui fait appel à l'histoire des allèles.

Des allèles sont dits identiques par descendance lorsqu'ils

proviennent de la copie d'un même allèle ancestral sans qu'aucune mutation n'intervienne lors des processus de réplication. Ces allèles ont donc tous comme origine la même séquence d'ADN qui a été dupliquée en de nombreux exemplaires.

Deux allèles identiques par descendance sont donc du même état allélique, mais la réciproque n'est pas vraie. Deux mêmes états alléliques (a1 par exemple) ne sont pas forcément identiques par descendance car ils peuvent provenir de deux événements

mutationnels distincts.

fig.2

b) Coefficient de consanguinité individuel :

On appelle coefficient de consanguinité, noté f la probabilité qu'un individu possède à un locus donné deux allèles identiques par descendance. Ces allèles identiques par descendance proviennent toujours de la copie sans mutation d'un allèle

a1

a1 a1

a2 a2

a2

a2 a1

Allèles dans pop ancestrale

a1a1

a2a2

Autozygotes (homozygotes)

a1a1

a2 a2

a2a2

Allozygotes (homozygotes)

a2 a1a2 Allozygotes

(hétérozygotes) a1

Mécanismes de réparation des dommages de l'ADN