Environnement Polymorphisme de séquence

(1)

Génétique quantitative et évolution Ferme du Moulon, 91190 Gif-sur-Yvette.

Le polymorphisme moléculaire et son exploitation en génétique et biotechnologies

Dominique de Vienne, Université Paris-Sud

devienne@moulon.inra.fr

http://moulon.inra.fr/~ddevienne/UE_EGFM_2016-2017

(2)

Le polymorphisme moléculaire

et son exploitation en génétique et biotechnologies

Introduction

Les différents types de polymorphismes moléculaires et leurs répercussions (éventuelles) sur le phénotype

Les marqueurs génétiques La notion de marqueur

Le génotypage (SNP, microsatellites, AFLP)

Utilisation des marqueurs en génétique et génomique Cartes génétiques

Cartographie de gènes à effets quantitatifs

Biol303. EGFM 2016–2017 Cours de Dominique de Vienne Mercredis 5, 12 et 19 octobre 2016, de 8h15 à 10h15

(3)

§  Locus, gène, allèle, polymorphisme neutre ou non neutre, dominance, récessivité, codominance, semi-dominance ou additivité.

§  Les marqueurs génétiques et techniques associées (SNP, microsatellites, AFLP)

§  Les principaux types de descendances en ségrégation

§  La cartographie génétique. Notion de taux de recombinaison et de distance génétique.

§  Utilisations des cartes génétiques.

Notions abordées

(4)

Variabilité phénotypique

(5)

Variabilité phénotypique

Environnement Polymorphisme de séquence

et de structure de l’ADN

« Génotypage » Profils (bandes, pics, etc.)

Sélection naturelle

Quelles sont les bases génomiques de la variabilité phénotypique ? Mutations

(6)

Polymorphismes au niveau de l'ADN

G A

1.  Single Nucleotide polymorphism (SNP)

transitions ( A G ou C T ) + fréquentes maïs : 1/60 bp

transversions ( A T ou C G ) + rares

2. Insertion-Deletion Polymorphism (IDP ou Indels) maïs : 1/150 bp

dont un cas particulier notoire…

Copy number variation (CNV)

(7)

Polymorphisme VNTR (ou microsatellites), « hyperpolymorphe »

Crossing-over inégaux

Variations du nombre de répétitions en tandem d'une séquence

Glissement de la polymérase

CTCTCTCTCTCTCT

GAGAGAGAGAGAGAGAGAGAGAGAGAGAGA

TCTCTCTCTCTCTC CT

C C T C

(8)

Allèle 1 Phénotype P1 Allèle 2 Phénotype P2

On ne fait pas de la génétique des caractères, mais des variations des caractères

Du génotype au phénotype

La variation phénotypique peut être discrète (ex. groupes

sanguins, couleur des yeux, etc.) ou continue (taille, poids, etc.)

(9)

Du génotype au phénotype

Effet du polymorphisme de l'ADN sur le phénotype

– ADN non-codant => en général pas d'effet, sauf

-  action régulatrice sur l'expression (promoteurs)

-  rôle dans la dynamique du génome (éléments transposables)

– ADN codant => effet possible seulement, car niveaux emboîtés de dégénérescence :

– dégénérescence du code génétique

– dégénérescence structure primaire => structure secondaire pour les ARNt – acides aminés de même propriétés chimiques

– relation entre flux métabolique et activité des enzymes : non linéaire – fonctions redondantes

Notion de « neutralité » phénotypique et sélective des polymorphismes moléculaires (M. Kimura)

(10)

Code génétique Tableau inversé

(11)

Genotype : sequence Phenotype :

secondary structure of pairings

Fontana & Schuster, JTB (1998)

Un phénotype, des génotypes

Au niveau de l’ARNt

(12)

Génotypes Phénotype

Un phénotype, des génotypes

Au niveau de l’ARNt

(13)

Genotype

Phenotype

tRNA Sequence

Secondary structure of pairings

folding

References Fontana & Schuster (1998) Lipman & Wilbur (1991) Ciliberti, Martin & Wagner (2007)

Très souvent, des génotypes différents conduisent à un même phénotype

Protein sequence

Three dimensional structure

Regulatory circuit

Gene expression levels

Un phénotype, des génotypes : autres niveaux

(14)

E₁ E₂ E_j E_n

X₀ S₁ ^… S_j S_j+1 ^… X_n

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5

0,55 0,6 0,65 0,7 0,75 0,8 0,85 0,9 0,95 1

Paramètre enzymatique

J

J : flux

X : constante A_j= « activité » E_j = concentration

∑

=

j AjEj

J X

1

E b J a

i

+

= 1

E_i

b a J =

Du génotype au phénotype

La relation entre les flux métaboliques et les activité des enzymes n’est pas linéaire.

Notion de « neutralité » phénotypique et sélective des polymorphismes moléculaires (M. Kimura)

(15)

Les marqueurs

moléculaires

(16)

Notion de marqueur génétique

Marqueur = locus marqueur :

Locus polymorphe (plus d'un allèle dans la population) qui renseigne 1. sur le génotype de l’individu qui le porte

=> génétique des populations, analyses de paternité, études de diversité, protection des variétés

2. sur le génotype d'un ou de locus voisin(s)

=> diagnostic, cartographie de QTL⁽¹⁾, sélection assistée par marqueurs, clonage positionnel

__________________________________

(1) Quantitative trait locus

(17)

Types de marqueurs

Marqueurs « à effet visible »

caractère morphologique, de coloration, etc., déterminé par un seul gène (ou gène majeur). Ex. pois lisse / ridé, couleur de fleur monogénique, etc.

Marqueurs « biochimiques »

historiquement : polymorphisme de molécules autres que l 'ADN ex. enzymes (1966), autres protéines, terpènes

Marqueurs « moléculaires »

Polymorphisme de séquence et de structure de l 'ADN

=> presque exclusivement utilisés actuellement, sauf cas particuliers

(18)

Les SNP

(19)

Les SNP (Single Nucleotide Polymorphisms)

Ø SNP : Site nucléotidique au niveau duquel un polymorphisme de substitution a été observé à une fréquence significative sur un ensemble de

génotypes (2 allèles dans la plupart des cas)

Ø Origine de l'information

- recherche spécifique de SNP sur des régions ciblées - séquençage génomique sur plusieurs génotypes

- Next Generation Sequencing (par rapport à un génome de référence)

G A

(20)

Ø  Marqueurs nombre quasiment illimité, répartis dans tout le génome (1/60 bp chez le Maïs, 1/1000 bp chez l'Homme)

presque toujours bialléliques

Ø  Haut débit d'analyse

Intérêt pour Cartographie génétique

Etudes de diversité / phylogénies Le clonage positionnel

Identification variétale

Les SNP

Intérêt en marquage moléculaire

(21)

Ø  Séquençage classique : de plus en plus accessible. NGS : Next Generation Sequencing, ou « reséquençage » : comparaison à un génome de référence.

Ø  Pas (encore) de méthode universelle

Foisonnement de recherches méthodologiques

Ø  Techniques visant le haut débit

robotiser le traitement des échantillons

éviter les étapes longues (électrophorèses,…) faible coût par échantillon

Les SNP

Méthodes de « génotypage »

(= déterminer le génotype aux locus marqueurs)

(22)

5'

3' ^C_A ^{Amorce R}

Amorce F2

5'

Amorce F1-M13

5'

G

Génotypage SNP par PCR allèle-compétitive

Electrophorèse

Appareil de lecture de fluorescence

(23)

C T A G

Position sur la puce quel allèle de quel SNP ?

A C

Produit PCR marqué fluo

Ex. ASOH, allele specific oligonucleotide hybridization Génotypage SNP avec des puces à ADN

(24)

Ex. ASOH, allele specific oligonucleotide hybridization Génotypage SNP avec des puces à ADN

(25)

Image brute

Analyse d’image

Génotypes Ex. ASOH, allele specific oligonucleotide hybridization

Génotypage SNP avec des puces à ADN

(26)

1 Gb sous forme de fragments de 25-35 bases d’ADN génomiques

Génotypage par séquençage. Ex. : méthode Illumina

^®

« Pelouse » de primers Adaptateurs

(27)

Génotypage par séquençage. Méthode Illumina

^®

PCR

(28)

Génotypage par séquençage. Méthode Illumina

^®

(29)

Génotypage par séquençage. Méthode Illumina

^®

Après dénaturation

(30)

Génotypage par séquençage. Méthode Illumina

^®

A la fin du processus

(31)

Nucléotides

fluorescents avec blocage réversible de l’extrémité 3’

Génotypage par séquençage. Méthode Illumina

^®

(32)

Lecture de fluorescence

Déblocage de l’extrémité 3’ des nucléotides et

suppression du fluorochrome Dénaturation et nouveaux cycles

Génotypage par séquençage. Méthode Illumina

^®

(33)

Les microsatellites

(34)

§  Répétitions en tandem de motifs mono-, bi-, tri- ou tétranucléotidiques

§  Les plus courants : (A)_n, (TC)_n, (TAT)_n, (GATA)_n….

§  Le nombre de répétitions (n) : de quelques unités à plusieurs dizaines.

Marqueurs microsatellites (SSR)

(35)

Eco RI 5'… G AATT C …3' 3'… C TTAA G …5'

Eco RV 5'… GAT ATC …3'

3'… CTA TAG …5' Sau 3A I 5'… GATC …3'

3'… CTAG …5'

Pst I 5'… C TGCA G …3' 3'… G ACGT C …5’

Rappel : la « restriction » enzymatique

*

Les enzymes de restriction sont des « ciseaux chimiques » extrêmement spécifiques

(36)

Extraction d'ADN Restriction enzymatique Sélect. de taille

Clonage en plasmide

Criblage de la banque : Transfert des colonies et hybridation avec sonde (CT)12 marquée

CTCTCTCTCTCTCTCTCTCTCTCTC

Anti- DIG Alk. DIG

Phosph

Substrat lumière

hybridation Plasmide

pUC 19 Insert

Extraction de plasmides des clones positifs, et séquençage des inserts

Région bordante Microsatellite Région bordante

Définition et synthèse d'amorces PCR spécifiques des régions bordant le microsatellite

Développement de microsatellites

(37)

Extraction d'ADN simplifiée

Plante 1 avec allèle court Plante 2 avec allèle long

Amplification PCR

Sites

d'amorçage spécifiques

Génotypage de microsatellites

(38)

(39)

Electrophorèse sur gel de polyacrylamide dénaturant (classique ou sur séquenceur)

(40)

- extraction d'ADN génomique total : pas forcément très pur quantité très faible (20 ng) - PCR avec des amorces spécifiques d'un point précis du génome (STS) - gel d'agarose haute résolution ou de polyacrylamide ou un séquenceur

monolocus codominant reproductible

hyperpolymorphisme VNTR

développement préalable très lourd génotypage très rapide

extractions d'ADN très rapides

Marqueurs microsatellites (SSR)

(41)

La technique d’AFLP

… mais d’abord, les deux autres techniques sur laquelle elle est fondée

Amplified Fragment Length Polymorphism

(42)

Eco RI 5'… G AATT C …3' 3'… C TTAA G …5'

Eco RV 5'… GAT ATC …3'

3'… CTA TAG …5' Sau 3A I 5'… GATC …3'

3'… CTAG …5'

Pst I 5'… C TGCA G …3' 3'… G ACGT C …5’

Rappel : la « restriction » enzymatique

*

Les enzymes de restriction sont des « ciseaux chimiques » extrêmement spécifiques

(43)

La technique de CAPS

Cleaved Amplified Polymorphic Sequences

Restriction enzymatique sur produits d'amplification PCR

Trois enzymes de restriction :

quatre

haplotypes dans la population

(44)

La technique de RAPD

Randomly Amplified Polymorphic DNA

(45)

multilocus dominant

peu reproductible (ne considérer que les bandes intenses) polymorphisme modéré par locus

pas de développement préalable très rapide

extractions d'ADN assez rapides La technique de RAPD

Randomly Amplified Polymorphic DNA

(46)

Principe de la technique AFLP

(47)

Exemples de AFLP

Electrophorèse capillaire

Electrophorèse en gel

(48)

multilocus dominant reproductible

polymorphisme modéré par locus peu de développement préalable rapide

extractions d'ADN assez rapides Marqueurs AFLP

(49)

Techniques ne nécessitant pas d'information de séquence AFLP Amplified Fragment Length Polymorphism RAPD Randomly Amplified Polymorphic DNA

Techniques appliquées à des produits d’amplification PCR (STS : sequence-tagged site)

SSR Simple Sequence Repeats, Microsatellites CAPS Cleaved Amplified Polymorphic Sequence Techniques pour SNP Single Nucleotide Polymorphism (diverses)

Les techniques usuelles de marquage

Point de vue BM Point de vue génétique

Marqueurs : -  multilocus -  dominants

Marqueurs :

-  locus-spécifiques -  co-dominants

(50)

Quels marqueurs pour quoi faire ?

Empreintes génétiques (marqueurs multilocus dominants)

– Etudes de diversité : structuration inter- ou intra-populations, distances génétiques, classifications, contrôle d'hybridations

– Clonage positionnel

– Saturation rapide de cartes génétiques

Marqueurs co-dominants locus-spécifiques

– Construction de cartes consensus (marqueurs, gènes) d'une espèce – Cartographie comparée (entre espèces : notion de conservation de synténie)

– Cartographie de QTL (Quantitative Trait Loci)

Police scientifique : SSR en multiplex

(51)

Cartographie génétique

(52)

Cartographie génétique

Carte génétique : agencement linéaire de locus le long d’un génome, dont les positions relatives ont été déterminées à partir des taux de recombinaison.

L’unité de distance est le centimorgan, et non pas le taux de recombinaison.

Ne pas confondre carte génétique et carte physique, dont l’unité de distance est le kilobase

(53)

Pourquoi cartographier ?

– Etude de l'organisation des génomes

– Cartographie comparée (étude de synténie)

– Cartographie de QTL (Quantitative Trait Loci) dans des croisements contrôlés, ou en populations (« génétique d’association »)

– Isolement de gènes (positional cloning) – SAM (Sélection assistée par marqueurs)

(54)

Descendances issues d’un croisement entre parents fixés

G1 D1

G2 D2

x

G1 D1

G2 D2

F1

A partir de la F1, on peut dériver trois types de descendances : -  types « haploïdes »

-  F2 (ou F3)

-  lignées recombinantes (ou « hautement » recombinantes)

(55)

Le taux de recombinaison

G1 D1

G2 D2

G1 D1 G2 D2 G2 D1 G1 D2

Parentaux : N – n Recombinés : n

Taux de recombinaison : r = n / N Méiose

Gamètes ou spores

(1 – r) / 2 (1 – r) / 2 r / 2 r / 2

0 ≤ r ≤ 0,5

Si r n’est pas significativement différent de 0,5, il y a indépendance génétique Si r est significativement inférieur à 0,5, il y a liaison génétique.

(56)

Pourquoi le taux de recombinaison ne doit pas être pris comme mesure de distance génétique

Une « bonne » distance doit satisfaire :

d

_AC

= d

_AB

+ d

_BC

A B C

r

_AC

≠ r

_AB

+ r

_BC

Or :

(57)

B A

b A

B A

b A

B A

B

A = Pas de recombinaison (0 CO ou nb pair de CO) b

A = Recombinaison (nb impair de CO)

Le problème des crossing-over multiples…

CO

(58)

Deux CO produits lors d’une même méiose ne sont jamais très proches les uns des autres

Avec interférence

Sans interférence (placement au hasard)

… et de l’interférence

(59)

De r à D :

les fonctions de

distance

(60)

Recombinaison et distance génétique

– Distance => additivité

– r n'est pas additif !

– Correction des doubles recombinants => Haldane (en cM)

– Prise en compte de l’interférence => Kosambi (en cM)

Centimorgan (cM) : distance entre deux locus telle que l’espérance du nombre de crossing-over lors d’une méiose est 0,01.

D_H = – 50 ln (1 – 2r)

0,32 1 Morgan (100 cM) ó 1 CO en

moyenne par méiose et par gamète

(61)

Descendances « haploïdes »

– Haploïdes doublés

– Mégagamétophytes (gymnospermes)

– Backcross

(62)

Parents F1

Haploïdes doublés

Méiose

Les lignées haploïdes doublés

Le stock chromosomique des produits de la méiose est doublé

« Génotypes graphiques »

La méiose est un processus qui fractionne peu le génome.

La mécanique de la méiose impose qu’il y ait au moins un crossing-over.

Locus A Locus B

(63)

H3

Vania F1

Haploïdes doublés de Capsicum annuum

(64)

Estimation du taux de recombinaison en backcross

G1 D1

G2 D2

G1 D1

G2 D2

Parents

F1

G1 D1

G2 D2

G1 D1

G2 D1

G1 D1

G1 D2

r = n / N Backcross

(65)

Mégagamétophytes

Méiose

Mégaspores => mégagamétophytes

Parents F1

Locus A Locus B

(66)

Populations F2

Parents

F1

F2

Autofécondations ou croisements frère-soeur

(67)

Estimation de r dans une F2

(1–r)/2 (1–r)/2 r/2 r/2

G1D1 G2D2 G1D2 G2D1

(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1

G1D1 G1D1 G1D1 G1D1

(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1

G2D2 G2D2 G2D2 G2D2

r/2 G1D2 ^G1D1 ^G2D2 ^G1D2 ^G2D1

G1D2 G1D2 G1D2 G1D2

r/2 G2D1 G1D1 G2D2 G1D2 G2D1

G2D1 G2D1 G2D1 G2D1

(68)

(1–r)/2 (1–r)/2 r/2 r/2

G1D1 G2D2 G1D2 G2D1

(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1

G1D1 G1D1 G1D1 G1D1

(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1

G2D2 G2D2 G2D2 G2D2

r/2 G1D2 ^G1D1 ^G2D2 ^G1D2 ^G2D1

G1D2 G1D2 G1D2 G1D2

r/2 G2D1 G1D1 G2D2 G1D2 G2D1

G2D1 G2D1 G2D1 G2D1

Estimation de r dans une F2

(69)

(1–r)/2 (1–r)/2 r/2 r/2

G1D1 G2D2 G1D2 G2D1

(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1

G1D1 G1D1 G1D1 G1D1

(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1

G2D2 G2D2 G2D2 G2D2

r/2 G1D2 ^G1D1 ^G2D2 ^G1D2 ^G2D1

G1D2 G1D2 G1D2 G1D2

r/2 G2D1 G1D1 G2D2 G1D2 G2D1

G2D1 G2D1 G2D1 G2D1

Estimation de r dans une F2

(70)

(1–r)/2 (1–r)/2 r/2 r/2

G1D1 G2D2 G1D2 G2D1

(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1

G1D1 G1D1 G1D1 G1D1

(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1

G2D2 G2D2 G2D2 G2D2

r/2 G1D2 ^G1D1 ^G2D2 ^G1D2 ^G2D1

G1D2 G1D2 G1D2 G1D2

r/2 G2D1 G1D1 G2D2 G1D2 G2D1

G2D1 G2D1 G2D1 G2D1

Estimation de r dans une F2

(71)

(1–r)/2 (1–r)/2 r/2 r/2

G1D1 G2D2 G1D2 G2D1

(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1

G1D1 G1D1 G1D1 G1D1

(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1

G2D2 G2D2 G2D2 G2D2

r/2 G1D2 ^G1D1 ^G2D2 ^G1D2 ^G2D1

G1D2 G1D2 G1D2 G1D2

r/2 G2D1 G1D1 G2D2 G1D2 G2D1

G2D1 G2D1 G2D1 G2D1

Estimation de r dans une F2

(72)

(1–r)/2 (1–r)/2 r/2 r/2

G1D1 G2D2 G1D2 G2D1

(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1

G1D1 G1D1 G1D1 G1D1

(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1

G2D2 G2D2 G2D2 G2D2

r/2 G1D2 ^G1D1 ^G2D2 ^G1D2 ^G2D1

G1D2 G1D2 G1D2 G1D2

r/2 G2D1 G1D1 G2D2 G1D2 G2D1

G2D1 G2D1 G2D1 G2D1

Estimation de r dans une F2

(73)

(1–r)/2 (1–r)/2 r/2 r/2

G1D1 G2D2 G1D2 G2D1

(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1

G1D1 G1D1 G1D1 G1D1

(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1

G2D2 G2D2 G2D2 G2D2

r/2 G1D2 ^G1D1 ^G2D2 ^G1D2 ^G2D1

G1D2 G1D2 G1D2 G1D2

r/2 G2D1 G1D1 G2D2 G1D2 G2D1

G2D1 G2D1 G2D1 G2D1

Estimation de r dans une F2

(74)

(1–r)/2 (1–r)/2 r/2 r/2

G1D1 G2D2 G1D2 G2D1

(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1

G1D1 G1D1 G1D1 G1D1

(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1

G2D2 G2D2 G2D2 G2D2

r/2 G1D2 ^G1D1 ^G2D2 ^G1D2 ^G2D1

G1D2 G1D2 G1D2 G1D2

r/2 G2D1 G1D1 G2D2 G1D2 G2D1

G2D1 G2D1 G2D1 G2D1

Estimation de r dans une F2

(75)

(1–r)/2 (1–r)/2 r/2 r/2

G1D1 G2D2 G1D2 G2D1

(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1

G1D1 G1D1 G1D1 G1D1

(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1

G2D2 G2D2 G2D2 G2D2

r/2 G1D2 ^G1D1 ^G2D2 ^G1D2 ^G2D1

G1D2 G1D2 G1D2 G1D2

r/2 G2D1 G1D1 G2D2 G1D2 G2D1

G2D1 G2D1 G2D1 G2D1

Estimation de r dans une F2

(76)

(1–r)/2 (1–r)/2 r/2 r/2

G1D1 G2D2 G1D2 G2D1

(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1

G1D1 G1D1 G1D1 G1D1

(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1

G2D2 G2D2 G2D2 G2D2

r/2 G1D2 ^G1D1 ^G2D2 ^G1D2 ^G2D1

G1D2 G1D2 G1D2 G1D2

r/2 G2D1 G1D1 G2D2 G1D2 G2D1

G2D1 G2D1 G2D1 G2D1

Estimation de r dans une F2

(77)

Fréquences théoriques et observées dans une F2

n₁/N n₂/N n₃/N n₄/N n₅/N n₆/N

n₇/N

n₈/N n₉/N

Un calcul de maximum de vraisemblance permet d’estimer la valeur la

plus probable de r.

Comment estimer r ?

(78)

Le maximum de vraisemblance

Application au problème de l'estimation de r dans une descendance F2

P ( X = k ) = n!

k ! ( n − k ) ^! ^p

k

( 1 − p )

^n−k

Pour une variable X qui suit une loi binomiale, on a :

P( X

₁

= n

₁

, X

₂

= n

₂

, ... , X

₉

= n

₉

) = N !

n

₁

!n

₂

! ... n

₉

! p

₁ⁿ¹

p

₂ⁿ²

... p

₉ⁿ⁹

Généralisation : loi multinomiale (ici appliquée au cas d'une F2)

où p_i = f(r)

(79)

Solution

(80)

Parents F1

F2

Autofécondation

> 6 générations SSD

Les lignées recombinantes

LR

Locus A RIL

Locus B

(81)

Lai et al. 2010. Nature Genetics, 42, 1027

La méiose est un processus qui (en général) fractionne peu le génome : la preuve par le séquençage (chez le maïs)

(82)

PI 414723 F1 Védrantais Lignées recombinantes de Melon

(83)

G1 D1 G1 D1

G2 D2 G2 D2

G2 D1 G2 D1

G1 D2 G1 D2

N – n n

Taux de recombinaison apparent :

R

0,5

0,0 0,1 0,2 0,3 0,4

0,0 0,1 0,2 0,3 0,4 0,5

r

Estimation de r dans des lignées recombinantes

r r N

R n

2 1

2

= +

=

(

^R

)

r R

= −

1 2

Taux de recombinaison :

(84)

F2

> 6 génér. AF

Les lignées hautement recombinantes

« Intermated Recombinant Inbred Lines »

LHR IRIL

n

générations d’intercroisements panmictiques

« Pseudo F2 »

Locus A Locus B

(85)

Plusieurs générations d’intercroisements aléatoires (panmixie)

Plus de crossing-over au total Plus de recombinaisons Distances génétiques allongées

Cartes plus précises pour un même effectif

Les lignées hautement recombinantes

« Intermated Recombinant Inbred Lines »

(86)

Estimation de

r

avec des lignées hautement recombinantes Winkler et al., 2003, Genetics

⎟⎠

⎜ ⎞

⎝

⎛ −

+

− −

= ⁿ

n r

r

R r (1 )

2 1

2 1 1

2

1 n : nombre de générations

de panmixie

R_n

0,0 0,1 0,2 r 0,3 0,4 0,5

0,0 0,1 0,2 0,3 0,4 0,5

R₀ R₂

R₄ R₆

A B

R₀ R_n

(87)

929.7 cM 198 cM

F2 IRIL

Allongement de la carte génétique du maïs (chromosome 1) dans des

lignées hautement recombinantes (IRIL)

(n = 4)

(88)

F₂

RIL IRIL

Multiparent Advanced

Generation InterCross (MAGIC) BC

NIL

Bergelson & Roux, 2010, Nature Review Genetics

Bilan des

descendances couramment utilisées en génétique

Bergelson & Roux, 2010, Nature Review Genetics

HIF: Heterogeneous Inbred Family RIL: Recombinant Inbred Lines IRIL: Intermated Recombinant Inbred Lines

BC: Back-Cross

NIL: Near Isogenic Lines

(89)

Estimation de r : bilan

§  Descendances de type haploïde : directe (r = n/N)

§  Descendances F2 (ou F3) : maximum de vraisemblance

§  Lignées recombinantes :

Dans chaque cas r doit être transformé via une fonction de distance => D (cM)

(

^R

)

r R

= −

1 2

(90)

Processus de cartographie génétique

– Tests deux-points (Chi² ou LOD) => groupes de liaisons

– Tests trois-points (LOD) => ordre au sein des groupes – Calculs des distances => carte génétique

– Utilisation d'un « squelette » => assignation à des "bins"

§  Il y a « saturation » lorsque, sur un groupe de liaisons, tous les marqueurs sont génétiquement liés de proche en proche, c’est-à-dire que r < 0,5 pour tous les marqueurs adjacents (et non pas D < 50 cM !).

§  Il y a autant de groupes de liaison que de chromosomes.

(91)

umc107a umc161a

4

(403 cM)

nc135

0

php20725a

43

umc31a

32

npi386

39

bnlg490

13 ⁶ phi026 umc1511

13

umc14a

13

bnlg1621

11

bnlg1189

55

umc66a

22

bnlg1444

50

umc158

6

csu39

30

php20608a

36

umc1050

36 5

(387 cM)

nc130

0

bnlg1006

9

npi409

12

bcd808d

58

umc1894

10

bnlg1879

24

rz474a

13

umc1705

21

bnl4_36

21

bnlg1892

8

bnlg1208

bnl5_71a

19

ph333597

11

umc126a

30

umc108

24

bnlg1836

27

bnlg118

40

umc1225

27

bnlg389

28

6

(333 cM)

bnlg1043

0

bnlg161

umc85a

24

umc1006

17

umc1595

10

umc65a

11

nc009

20

umc21

27

bnlg2249

20

umc1020

15

nc013

22

umc38a

29

umc132a

36

phi070

6

umc1897

51 ⁷ bnlg1740 bnlg1136

21

umc1653

5

umc1127

8

12 1

2

(386 cM)

0

18

17

21

14

umc1756

14 10

umc44b

15 8

27

25

bnlg166

11

9 phi092

6 7

16

bnlg2077

10

asg20

bnlg1721

12 10 8

phi090

14 10

12

umc1256

10

38

lim104

32

2

1

(596 cM) Phi097

0

umc1977

42

umc157

31

bnlg1007

59

umc76

24

bnlg147

24

bnlg1203

22

php20725b

asg45

17

bnlg1811

15

csu3

19

umc67

37

umc1709

48

asg62

14

umc1833

53

umc128

30

umc1924

13

csu164a

19

21

20

bnlg1055

20

phi064

51

bnl6_32

13

1 2 3 4 5 6 7 9 8 10 11

bnl8_45a

phi96100 bnlg1017 mmc0111 bnlg1302

umc6a

bnlg1537 bnlg1393

umc34

bnlg1018

umc131 umc255a

bnlg1329 mmc0143 dupssr24 dupssr30 bnlg1746

umc49a

bnlg1893

1 2 3 4 5 6 7 8 9

10

4 5

1 2 3 45

7 8

9 6

10 11

6

1 2 3 4 5 6 7 8

2 1 3

4 5 6 7

8

0 0 0

3

(529 cM)

umc1746

bnl8_15

umc1970

csu32

bnlg1523

asg24

bnlg1904

asg48

umc1012 umc1392

bnlg2047 dupssr05 mmc0312 umc1527

umc102

umc1501

bnl5_37a

bnlg1350 bnlg1951 bnlg1931 bnlg1160

bnl6_16a

umc1135 umc1399 umc1489 mmc0071

umc16a

umc1140 bnlg1108 umc1273

umc63a

bnlg1257 bnlg1182 bnlg1536 bnlg1754 bnlg1496

csu25a

38

umc1062

6

umc1641

6

3

0

15

26

29

25

16

15 5

18 10

10 7

20

33

34

29

20 9 13 14

18 7 8

27 6 10 6

14

14 6

1 2 3 4 5

7 8 9 10 6

0

7

(385 cM)

umc1545

0

bnlg1367

20

bnlg2132

50

asg8

10

mmc0171 php20581a

10

phi112

20

umc1016

21

phi034

8

bnl15_21

42

bnlg434

13

dupssr09

8

bnlg2271

18

umc254

14

bnlg1666

30

bnlg2259

41

umc1295

6

umc245

42

phi116

30

7

1 0

2 3

4

5

6 ^{(389 cM)}⁸

npi220a

0

umc1592

15

umc1327

23

bnl9_11a

19

umc1034

31

umc124

10

bnlg1834

17

bnlg1863

15

bnl7_08a

25

bnl2_369

17

umc1316

23

bnlg1152

31

bnlg1065

43

bnlg1823

25

umc1268

6

npi414

8

agrr21

29

bnlg1131

53

9

(322 cM) umc109

0

bnlg1810

30

umc192

11

dupssr06

9

bnlg244

26 umc1033

phi061

6

phi065

15

csu147

11 bnlg1714 phi032

19

umc95

14

rz574b

15

umc1366

43

umc1789

25 ⁶ umc1804 bnlg619

12

bnlg128

15

csu54b

59

8 9

1 2 3

4

9 6 7 8 5

1 2 3

4

6 7

8 5

10

(261 cM) php20075

0

npi285

28

phi059

22

umc130

10

bnlg1712

16 umc64a

bnlg1526

7

umc259

17

umc44a

37

bnlg2190

27

bnl7_49a

18

bnlg1360

20

bnlg1450

24

bnlg1185

34

10

1 2 3

4 6 7 5

9

Carte génétique du maïs

(cM. Distance de Haldane)

(92)

Commentaires sur les cartes génétiques

– Relations carte physique – carte génétique – Notion de synténie (synteny)

– La cartographie fine

(93)

Relations carte physiques – carte génétiques

(94)

Physical and genetic maps of chromosome 4

of A. thaliana (Schmidt et al. 1995, Science, 270, 480)

Comparaison carte physique – carte génétique

Les banques de grands fragments d’ADN

(BAC, YAC) ont

permis de construire des cartes physiques

(95)

B73 sequence

IBM genetic map

Dist. génétiques (cM) Dist. physiques (Mbp)

Ganal et al., 2011

Comparaison carte génétique / carte physique chez le maïs : la carte génétique peut révéler des erreurs d’assemblage du génome

(96)

centromère Chrom 3

Position physique sur la séquence de la lignée B73 (Mbp) Position génétique (centiMorgan) Taux de recombinaison (cM/Mb)

Ganal et al., 2011

IBM LHRF

Comparaison carte physique – carte génétique (lignée de maïs B73)

Ganal et al. 2011.

PLoS ONE.

Les deux couleurs correspondent à deux

croisements différents

(97)

(98)

Différences entre sexes

(99)

Mercier et al., 2015

Nombre moyen de CO par chromosome et par méiose chez divers eucaryotes

Champignons Animaux

Plantes Autres

Un point représente un c h r o m o s o m e d ’ u n e espèce.

Alors que la taille physique des chromosomes varie de plus d'un facteur 1000, le nombre de CO par chromosome reste la plupart du temps entre 1 et 3 ou 4. Il existe donc une forte régulation pour limiter le nombre de CO.

(100)

Notion de synténie (« même fil »)

On parle de synténie lorsque les gènes ou marqueurs sont portés par le même chromosome, qu’ils soient génétiquement liés ou pas. Il peut alors y avoir colinéarité ou pas.

(101)

Devos & Gale (2000) Plant Cell, 12, 637.

(102)

Duplications dans le génome du riz Synténie riz-orge

Evidence and evolutionary analysis of ancient whole-genome duplication in barley predating the divergence from rice

Thiel et al. 2009. BMC Evolutionary Biology, 9:209

(103)

La cartographie fine

Principe

Utiliser la recombinaison

Matériels génétiques

– Lignées quasi-isogéniques (Near-isogenic lines – NIL), et lignées d’introgression (IL)

– Lignées “hautement” recombinantes (LHR)

(Intermated recombinant inbred lines – IRIL)

(104)

x

x Backcross

(BC)

Parent F1 récurrent

BC1 : 1/2

BC2 : 1/4

BC3 : 1/8 etc.

x

(105)

BC2

(106)

Parent récurrent Parent

donneur

Région à « introgresser »

x x x x

x

Crossing-over

Construction de lignées quasi-isogéniques NIL : Near Isogenic Lines

(107)

BC4

M

⊗ ⇒

¼ ¼ ½

NIL

+ rares recombinants Construction de lignées quasi-isogéniques

NIL : Near Isogenic Lines

(108)

_ + +

R D R’_(NIL)

R D R’ R D R’ R D R’

Recherche de marqueurs dans une région donnée

Le marqueur est dans la région introgressée

Environnement Polymorphisme de séquence

Le polymorphisme moléculaire et son exploitation en génétique et biotechnologies

http://moulon.inra.fr/~ddevienne/UE_EGFM_2016-2017

Notions abordées

Variabilité phénotypique

Environnement Polymorphisme de séquence

et de structure de l’ADN

Polymorphismes au niveau de l'ADN

Allèle 1 Phénotype P1 Allèle 2 Phénotype P2

Du génotype au phénotype

Du génotype au phénotype

Genotype : sequence Phenotype :

secondary structure of pairings

Un phénotype, des génotypes

Au niveau de l’ARNt

Un phénotype, des génotypes

Au niveau de l’ARNt

Un phénotype, des génotypes : autres niveaux

∑

Du génotype au phénotype

Les marqueurs

moléculaires

Notion de marqueur génétique

Types de marqueurs

Les SNP

Génotypage par séquençage. Ex. : méthode Illumina

Génotypage par séquençage. Méthode Illumina

Génotypage par séquençage. Méthode Illumina

Génotypage par séquençage. Méthode Illumina

Génotypage par séquençage. Méthode Illumina

Génotypage par séquençage. Méthode Illumina

Génotypage par séquençage. Méthode Illumina

Les microsatellites

Marqueurs microsatellites (SSR)

La technique d’AFLP

… mais d’abord, les deux autres techniques sur laquelle elle est fondée

La technique de CAPS

Cleaved Amplified Polymorphic Sequences

Cartographie génétique

Cartographie génétique

Pourquoi cartographier ?

Descendances issues d’un croisement entre parents fixés

x

Le taux de recombinaison

d

= d

+ d

r

≠ r

+ r

Le problème des crossing-over multiples…

… et de l’interférence

De r à D :

les fonctions de

distance

Recombinaison et distance génétique

Descendances « haploïdes »

Estimation du taux de recombinaison en backcross

Mégagamétophytes

Populations F2

Estimation de r dans une F2

Estimation de r dans une F2

Estimation de r dans une F2

Estimation de r dans une F2

Estimation de r dans une F2

Estimation de r dans une F2

Estimation de r dans une F2

Estimation de r dans une F2

Estimation de r dans une F2

Estimation de r dans une F2

Le maximum de vraisemblance

P ( X = k ) = n!

k ! ( n − k ) ! p

( 1 − p )

P( X

= n

, X

= n

, ... , X

= n

k ! ( n − k ) ^! ^p