HAL Id: hal-02796762
https://hal.inrae.fr/hal-02796762
Submitted on 5 Jun 2020
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Etude d’association dans des variétés synthétiques : cas du gène GAI et de la croissance foliaire chez le ray-grass
anglais
Philippe Barre
To cite this version:
Philippe Barre. Etude d’association dans des variétés synthétiques : cas du gène GAI et de la croissance foliaire chez le ray-grass anglais. Master. Biologie Végétale Intégrative : Gène, Plante, Agrosystème (BioVIGPA), 2015, 59 diapos. �hal-02796762�
Etude d’association dans des variétés
synthétiques :
cas du gène GAI et de la croissance
foliaire chez le ray
-
grass anglais
Philippe Barre
D’après la thèse de Jérôme Auzanneau
Centre INRA Poitou-Charentes
Unité de Recherche Pluridisciplinaire Prairies et Plantes Fourragères
86600 Lusignan
Plan
• Contexte général
– Les prairies
– Le déséquilibre de liaison – Les études d’associations
• Partie 1 : Evaluer dans des variétés synthétiques les caractéristiques nécessaires pour faire des études d’association
• Partie 2 : Une étude d’association dans une variété synthétique
- Source d’énergie et de protéine la moins onéreuse - Impacts environnementaux positifs
⇒ sous réserve de pratiques raisonnables
Le ray-grass anglais est la graminée la plus utilisée dans les prairies semées en régions tempérées humides
Contexte général
Agriculture durable Nourrir les herbivores
Prairies semées : pâturées ou
Deux facteurs importants pour nourrir
les herbivores
Qualité Quantité Longueur de feuilles Densité de tallesEtudiée à l’UGAPF et l’UEPF Agit sur la vitesse d’ingestion au pâturage
Il existe des QTL
• Excellente digestibilité et bonne valeur énergétique
Ray-grass anglais
Deux méthodes pour identifier les gènes ou les régions du génome qui contrôlent les caractères
• Recherche de QTL à partir de populations dérivées d’hybrides F1
– Bases génétiques étroites (deux parents) – Peu de recombinaisons
– Création des populations parfois difficile
• Etude d’association Phénotype/Génotype sur des populations naturelles
– Fonction du déséquilibre de liaison (DL) de la population étudiée
– Populations parfois structurées et détection
d’associations dues uniquement à la structuration
Des populations idéales seraient des populations multi-parentales et non structurées
1 2 2 Distance 2 gène
Le Déséquilibre de liaison (DL)
2Le déséquilibre de liaison est l’association non aléatoire des allèles à deux locus
Déséquilibre complet : |D|=0.25, |D’|=1.0, r²=1.0 Pas de déséquilibre : |D|=0, |D’|= 0, r²= 0
Deux approches pour les études
d’associations
(Rafalski, 2002)
DL faible : « gène candidat »
• précis
• sur une région limitée
DL fort « Genome scan »
• exhaustive sur l’ensemble du génome
Facteurs faisant varier le DL
• Taux de recombinaison et nombre de générations
• Mode de reproduction
• Histoire démographique de la population • Sélection
• Taux de mutations
• Structuration
(Flint-Garcia et al, 2003 ; Gupta et al, 2005)
DL DL DL DL Autogame Allogame Goulet d’étranglement DL
Pour les études d’association, on considère qu’un r² > 1/3 entre le marqueur et le gène est suffisant pour pouvoir détecter une association (Ardlie et al., 2002)
Prise en compte de la structuration
dans les études d’association
• Evaluation de la structuration à partir de
marqueurs « neutres » répartis sur l’ensemble du génome (exemple: Structure, Pritchard et al. 2000)
• Division de la population en groupes identifiés précédemment
• Recherche d’associations à l’intérieur de chaque groupe
• Limites :
– taille des groupes
Chez le ray-grass anglais comme chez de nombreuses espèces fourragères et à gazon
⇒ variétés synthétiques Variété synthétique commercialisée 3 ou 4 générations de « panmixie » X constituants 4 < X < 300 (ou plus)
Les variétés synthétiques semblent
intéressantes pour les études d’association
• Pas de structuration
• Pas de DL entre loci non liés physiquement
• Base génétique +/- large
– Base + large : on attend un DL qui décroît rapidement
– Base + étroite : on attend un DL qui décroît lentement mais uniquement dû à une liaison physique
“gène candidat”
Objectif
Tester si les variétés synthétiques sont pertinentes pour identifier les gènes ou les régions du génome responsables des variations des caractères quantitatifs chez le ray-grass anglais
Stratégie
• Evaluer dans des variétés synthétiques les caractéristiques nécessaires pour faire
des études d’association
• Réaliser une étude d’association dans une variétés à base génétique large (Herbie) sur l’exemple d’un gène candidat
Gibberelic Acid Insensitive (GAI) pour la croissance foliaire
Les gènes candidats de la croissance
foliaire
Tous les gènes qui interviennent dans : • La perception du signal • L’intégration du signal • La biosynthèse des hormones végétales • Le cycle de division cellulaire • Disponibilité en C et N Division cellulaire Elongation cellulaire Croissance foliaire
Conclusion : Il existe de nombreux gènes candidats pour la croissance foliaire
GAI candidat pour la croissance foliaire
chez le ray
-
grass anglais
• Impliqué dans la croissance des tiges chez de nombreuses graminées
• Chez le ray-grass anglais, croissance des tiges et croissance des feuilles sont liées • Il existe un QTL de longueur de feuilles
sur LG4 qui explique 5 à 10 % de la variabilité
LG3 AGCCAA198 0,0 rv1391 23,0 Lpssr027 39,0 K16.1000 49,4 ACCCTA168 56,6 ACACTG225 62,6 ACACTG162 79,1 ACACAG240 135,6 FL42 rv0301 M16B B2G6 NFFA112 LG1 AACCTG159 0,0 ACTCAA275 29,9 PRE* 47,1 AAGCTT186 61,5 DLF027** 72,7 rv1391** 79,9 B1B6** 103,9 ACGCTA757 142,3 FC61 M16B** TRX rv0301*** LG2 ACCCAA208 0,0 AGCCAA265 11,0 AGCCAA340 33,9 M4-136 50,1 ACGCTA568 68,6 ACCCAA300 91,2 ACTCAT225 103,4 K16.1600 114,4 ACACAA177 121,5 ACCCTA110 128,9 ACACAA175 139,4 FL42 syn377-1 Lpssr021* LHAB rv0116 Lpssr112 B3D12 ACCCAA310 0,0 Lpssr021 12,1 ACCCAA375 22,7 Lpssr112** 39,4 AACCTA267 61,6 AAGCTC319 84,6 M15185 94,0 AACCTG148 101,2 PR24 112,2 AACCAC136 130,2 FC61 syn340-1 rv0116 syn397-1 NFFA023 Lpssr076 PR3 AAGCAC248 0,0 ACGCAG345 46,4 AGCCAA135 53,7 AGGCTA240 73,7 PHOS 81,6 B1B3 92,2 AGGCAA125 109,9 AGGCAA274 122,8 FC61 B1A2 NFFA099 NFFA018 B1C9 B3B8 AAGCAC450 0,0 ACACTC400 24,8 ACGCAA287 33,6 AGCCAA298 45,7 ACCCAA266 54,7 Uni001* 63,6 AAGCAT360 88,5 AAGCAT175 100,7 rv1046* 116,0 B1A10 127,1 AGCCAA100 146,7 LPSSRH01A10 157,4 B1C9 163,0 AGGCAG365 169,7 ACGCAG200 182,3 AGGCAT271 212,5 AACCAG117 217,4 AACCAC230 225,5 AAGCAT500 242,9 ACTCAA326 256,2 FL42 NFFA109 NFFA033 LG4 PR14* 0,0 ACCCAG223 47,7 ACCCTG96* 64,6 Lpssr082 79,7 AAGCTG148* 93,8 ACCCTA212 102,1 ACGCTG264 110,2 AGGCAG300 122,8 AGCCAG370 129,0 rv0966 136,7 ACTCAT380 178,2 FL42 AAGCAC455 0,0 PCI 32,2 AAGCTT305 45,6 Lp20ox 83,5 Lpssr110** 113,4 a b PRG NFFA132 NFFA113 Lpssr023 Lpssr011 LPSSRH01H06 DLF025* NFFA017 syn4067-1 rv0380 syn3806-1 ACCCAC175 0,0 ACCCTG236 26,2 ACCCAT231 43,3 AGGCTG193 54,4 ACCCAC316 60,7 A17.800 67,3 ACTCAT360 76,1 H12.800 81,3 ACCCAT132 85,9 ACCCAG135 91,9 ACCCAG133 96,9 NGLRI_LM_2-5A 101,5 AACCTC378 106,4 ACTCTC442 113,3 AACCTA203 120,6 ACACTG118 132,7 LPSSRH01H06 140,7 ACACTC272 149,0 ACGCAC345 153,7 ACTCAT148 162,1 ACCCAA320 171,1 AGCCAA282 184,8 ACACAG174 193,2 AACCTT309 199,4 ACACTG496 214,2 AAGCAC208 242,4 AAGCAC400 255,8 FC61 PRG Lpssr011 Lpssr082 Lpssr006 CAF Lpssr023 NFFA143 M144 syn4067-1 rv0966 syn2808-1 rv0454 LG5 AGCCAA268 0,0 ACACAT269 15,3 AGCCAA168 37,5 ACTCTC202 56,7 ACTCAT328 73,2 ACCCTA239 79,3 syn20738-1 89,0 LPSSRH01A02 90,0 ACGCAA148 94,4 AGGCAC161 100,6 AACCAG324 110,9 AAGCTG192 149,0 FL42 rv0260** 0,0 nph1 10,9 AGGCTC209 20,6 ACACAC290 29,5 ACACAC459 40,9 AGGCAT219 46,3 a b B2F1 Lpssr059 rv0082 ACTCAA168 0,0 ACACAA121 10,7 AACCAC330 23,0 ACCCTA163 33,7 NFFA069 40,3 ACACTG470 52,8 ACACTG360 63,1 AAGCTC314 67,3 AACCTT222 71,4 ACACAG105 75,5 ACACTC345 80,2 AGGCAT326 91,4 LP8 101,6 AGGCAA155 132,9 FL61 rv0260 0,0 AGGCTC207 14,0 nph1 24,5 AGGCTC309 36,6 AGCCAG162 51,7 a b NFFA087 B5E1 Syn20738-1 CYP LG6 ACGCAA251 0,0 ACACTG368 13,2 AACCTT265 39,8 NFFA038 55,2 NGLRI_LM_3-4F 58,5 LP20 68,0 FL42 rv0739 rv1208 0,0 ACACAA145 19,9 AAGCAT295 30,8 ACACAG129 41,5 AACCTG121 49,8 AACCTT153 58,7 SER 64,9 ACGCAA176 74,8 AAGCAT184 81,8 AGGCTA266 88,3 ACGCAT242 99,4 B1A8 107,8 ACTCTC315 124,6 NGLRI_LM_3-4F 132,2 rv0739 140,7 FC61 syn2611-2 LG7 AGGCAA118 0,0 rv0810* 40,2 Lpssr066 62,4 Lpssr020 82,6 AAGCAT230 98,0 ACCCAG410 109,3 ACCCTG202 115,2 AACCTA372 129,8 ACCCTA297 138,6 ACACTG152 150,2 AGGCAC165 157,9 DLF020 206,6 FL42 OSW B1C8 rv0311 NFFA114 NFFA123 DLF008 rv0248 AAGCAC345 0,0 AAGCAC280 12,3 AGCCAA242 31,6 AGCCAA90 35,5 AAGCTG178 40,4 AGGCAT182 49,8 Lpssr017 55,7 Lpssr066 58,1 NFFA123 70,5 AAGCTG134 82,0 Lpssr020 100,5 ACGCTA433 113,1 FC61 rv810** DLF008 LP165 NFFA114 rv1411 syn3907-2 DLF020 Heading00 LaminaApr00 LaminaOct99 H080300 H140400 Leaf01 Lamina01 Sheath01 LER01 LED01 Legend of QTLs Carte génétique et QTL de croissance foliaire chez le ray-grass
Stratégie
• Evaluer dans des variétés synthétiques les caractéristiques nécessaires pour faire
des études d’association
• Réaliser une étude d’association dans une variétés à base génétique large (Herbie) sur l’exemple d’un gène candidat
Gibberelic Acid Insensitive (GAI) pour la croissance foliaire
Partie 1 : Evaluer dans des variétés
synthétiques les caractéristiques nécessaires pour faire des études d’associations
Etude de 3 variétés à base génétique
contrastée (troisième génération de panmixie)
– variabilité génétique et équilibre HW – vérifier la non structuration
– déterminer le patron de décroissance du DL pour choisir le type d’approche (région de GAI)
Matériel végétal
• 3 variétés commerciales de ray-grass anglais : – Aberavon : base génétique étroite (6 constituants
apparentés)
– Herbie : base génétique large (336 constituants) – Brest : intermédiaire (10 constituants non
apparentés)
• 1 Core collection comme témoin de la variabilité existante au sein de l’espèce
Aberavon
7 parents 1 2 3 4 5 6 5 7
8 générations
7 cycles de sélection Passage par 2 ou 3 femelles seulement sur les 4 dernières
générations
Sélection individuelle : démarrage précoce, floraison tardive, résistance aux rouilles
Sélection sur famille : rendement, couverture du sol, digestibilité in vitro 6 plantes sélectionnées Variété commerciale 4 générations de panmixie
Herbie
Trani Hora Perma Vigor
4 variétés (origine hollandaise) 4 x 84 = 336 individus Variété commerciale 4 générations de panmixie
Marqueurs moléculaires
• 6 SSR (Simple Sequence Repeat) : 3 sur LG 4, 1 sur LG 1, LG3 et LG7
– Etude structuration, variabilité et équilibre HW • 6 STS (Sequence Tagged Site)
autour de GAI
– Etude du DL, variabilité et équilibre HW
Alm et al, 2004
GAI
Code de couleur pour les chromosomes
Pseudo molécule de riz : LG 3 (TIGR 30/12/2004) ⇒ LG 4 RGA
STS
AC133334 AC091775 AC087797 AC087181 AC082645
STS2 STS4 GAI STS5bis STS5
1,5Mb
300pb
77,5Kb 180Kb 219Kb 3Kb
300pb 1324pb 300 pb 1000pb 1044pb
Distance chez le riz / Longueur chez le ray-grass anglais
AC118133 STS9 1pb 3634 7804 pb GAI
Distance entre marqueurs
rv0966 RYE12 ADH LPSSR023 LPSSR082 PRG 9 8 2 4 53 STS4, STS9, GAI 8 STS5 7STS4, STS9 et GAI : utilisation des distances physiques (pb) observées chez le riz
STS5 et SSR : utilisation des distances génétiques (cM) observées chez le ray-grass anglais et conversion en distance physique (1 cM = 3,5 Mb)
cM
Trois types de données
• Données de marqueurs SSR ⇒ génotype
• Données de séquence de clones (STS4 et
STS5) ⇒ haplotype
• Données de séquence de produits PCR (STS2, STS4, STS5, STS5bis, STS9 et
GAI) ⇒ génotype
Données de séquences de clones
Calcul du DL :
Déséquilibre de liaison gamétique
A B A b a b a B Gamètes … … b … fA x fB B a A L1 L2 L1 L2 … … b … fAB B a A L1 L2 Fréquences théoriques : H0 = association aléatoire
Calcul du DL chez les hétérozygotes
• On ne connaît pas la phase haplotypique
Locus L1 L2 Génotype Aa Bb A B a b B a b A O u Solutions : - Estimation de la phase en supposant l’équilibre d’Hardy
–Weinberg (logiciel PHASE 2.1
Stephens et al. 2001, Stephens et Donnlly 2003)
- Calcul d’un déséquilibre de liaison génotypique
Calcul du DL :
Déséquilibre de liaison génotypique
AA BB Aa Bb aa bb Génotypes L1 L2 Fréquences théoriques : H0 = association aléatoire
entre génotypes des 2 loci Fréquences observées :
… … … bb … fAaxfBb … Bb … … … BB aa Aa AA L1 L2 … … … bb … fAa/Bb … Bb … … … BB aa Aa AA L1 L2
Résultats
• Variabilité, équilibre HW et stucturation • Déséquilibre de liaison
0,76 0,60 0,42 Hétérozygotie attendue 0,26* 0,06 0,14 Fis 16,3 10,3 3,3 Nombre moyen d’allèles Cc Her3 Abe SSR 0,004 0,005 0,0002 STS4 30 32 72 pb / SNP 0,008 0,008 0,0002 STS5 0,29* -0,01 -0,03 Fis Cc Her3 Aber STS
Variabilité et équilibre HW
π
Conclusion : • Aberavon très peu variable • Variabilité d’Herbie comparable à celle de la Cc• Pas d’écart à l’équilibre HW dans ces variétés
synthétiques * Significatif à 0,01
0 0.2 0.4 0.6 0.8 1 0 1 2 3 4 5 6 7 8
Nom bre de groupes supposés
P ro b a b il it é s Abe Her3
Structuration
Conclusion : Pas de structuration dans ces variétésDéséquilibre de liaison autour de GAI :
DL gamétique à courte distance (0 – 800 pb)
Conclusion : Valeurs de DL Abe > Valeurs de DL Her3
0 0.2 0.4 0.6 0.8 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 r² F ré q u e n c e s d e s t e s ts s ig n if ic a ti fs Abe Her3 ≥ ≥ ≥ ≥ ≥ ≥ ≥ ≥ ≥ ≥ =
Déséquilibre de liaison autour de GAI :
DL génotypique à grande distance
Abe 0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 P-value 0.6 0.8 1 F re q u e n c e s c u m u lé e s
Conclusion : Le DL est significatif sur une plus grande distance dans Abe que dans Her3
Her3 0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1 P-value F ré q u e n c e s c u m u lé e s 0-500 bp 174-175 kb 1.6-1.8 Mb
14-49 Mb 185-259 Mb Non lié physiquement LE
Conclusion Partie 1
• La variabilité des variétés synthétiques est plus ou moins grande en fonction du nombre de constituants
• Dans les variétés à base génétique large
le DL décroît rapidement ⇒ “géne candidat”
• Dans les variétés peu variables le DL décroît lentement mais plus rapidement qu’attendu
– ceci peut s’expliquer par l’apparentement des 6 constituants
• Pas de structuration et pas d’écart à l’équilibre HW
Partie 2 : Etude d’association entre GAI
et la croissance foliaire
• Etude de type “gène candidat” dans une variété à base génétique large : Herbie
– Variabilité phénotypique (croissance foliaire) – Variabilité génétique (gène GAI)
– Recherche de corrélations entre polymorphisme phénotypique et polymorphisme génétique
Phénotypage
2 expérimentations
Printemps Automne
• 186 individus de Her4 • 186 individus de Her4
• 100 individus Cc
Cinétique de croissance sur les feuilles entières
3 (f3) et 4 (f4)
Longueur maximale : Lmax Vitesse maximale : Vmax d’élongation
0 50 100 150 200 250 -200 -100 0 100 200 300 400 500 600 Temps (°C.j) L o n g u e u r (m m ) Longueurs mesurées Lmax Fonction Béta
Longueur fonction de t, tc, t(vitesse maximale), te et longueur maximale
Modélisation de la croissance foliaire :
0 50 100 150 200 250 -200 -100 0 100 200 300 400 500 600 Tem ps (°C.j) L o n g u e u r (m m )
Longueurs mesurées Longueurs estimées
te tc tc5 Da Lmax 0 50 100 150 200 250 -200 -100 0 100 200 300 400 500 600 Tem ps (°C.j) L o n g u e u r (m m ) -0.2 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 V it e s s e ( m m /° C .j )
Longueurs mesurées Longueurs estimées Vitesses d'élongation estimées
te tc tc5 Da Lmax tm Vmax (Verdenal et al. in press)
• Données printemps et automne analysées séparément car :
– Il existe des interactions génotype X période – Il existe des QTL de longueur de feuilles
différents au printemps et à l’automne
Résultats
• Variabilité de la croissance foliaire • Variabilité du gène GAI
Variabilité de la croissance foliaire : feuille 3, Her4 0,46 0,74 0,77 Héritabilité individuelle 0,0001 0,0001 0,0001 Effet géno. (p) Printemps Automne 0,39 0,0001 Da 0,67 0,0001 Vmax 0,64 0,0001 Lmax Héritabilité individuelle Effet géno. (p) Variable
Conclusion : fortes héritabilités pour la longueur et la vitesse maximale et plus faible héritabilité pour la durée d’allongement
Variabilité de la croissance foliaire : feuille 3, automne, Her4 et Cc
245 267 1,57 1.64 270 301 Moy 173 187 0,81 0,84 118 126 Min 909 401 Her4 Da (°Cj) 841 321 Cc Da (°Cj) 0,13 2,73 Cc Vmax (mm/°Cj) 0,09 2,56 Her4 Vmax (mm/°Cj) 4814 478 Cc Lmax (mm) 4245 450 Her4 Lmax (mm) Var Max Variable
Conclusion : La variabilité phénotypique d’Her4 est comparable à celle de la Cc
0 1
0 50 100 150 200 250 300
position (pb) SNP
Variabilité du gène GAI chez Her4
Variabilité du gène GAI chez Her4
26 CCGCCCGGGGCCCCGCGCAG 37 18 CCGCCGGAGGGGCCGCGCAG 30 50 CCGCCGAGCGCCCCGCGCAG 27 15 CCGCCGAAGGCCCACGGCGG 25 56 CCGCCGAAGGCCCACGGCAG 24 14 CCGACCAGGCCGGCGCGCAG 15 17 CCGACGGGGCCGCCGCGCAG 10 57 CCGACGGGGCCGGCGCCCAG 9 66 CCACTGAAGCCGGCGCGCAG 2 Inferred no. in sample Haplotype Haplotype no.Déséquilibre de liaison dans GAI chez Her4
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 50 100 150 200 250 Distance (pb) r² 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 P-value F ré q u e n c e s c u m u lé e s 0-25 pb 25-50 pb 50-100 pb 100-150 pb > 150 pb LEEtude d’association
• Trois méthodes :
– Analyse de variance sur la présence versus absence de chaque haplotype
– Régression linéaire multiple en considérant tous les SNP
– Analyse de variance sur les groupes formés à partir d’un arbre phylogénétique (TREESCAN, Templeton et al., 2005)
Analyse de variance sur la présence versus l’absence de chaque haplotype
Automne Printemps Nb. of Nb. of Haplo. 0,943 0,525 0,671 0,758 0,978 0,912 161 25 37 0,756 0,918 0,848 0,066 0,418 0,831 169 17 30 0,801 0,286 0,227 0,410 0,123 0,077 141 45 27 0,369 0,830 0,511 0,725 0,998 0,623 171 15 25 0,283 0,322 0,594 0,970 0,496 0,786 132 54 24 0,600 0,185 0,331 0,761 0,603 0,953 172 14 15 0,355 0,681 0,451 0,706 0,467 0,491 169 17 10 0,130 0,143 0,684 0,220 0,645 0,810 136 50 9 0,208 0,249 0,649 0,169 0,071 0,032 126 60 2 Da Vmax Lmax Da Vmax Lmax samples -samples +
Régression linéaire multiple sur les 20 SNP 0,0124 GAI048 0,0159 GAI039 0,0164 GAI060 (°Cj) 0,0755 0,0187 GAI069 Da 0,0183 GAI189 0,0185 GAI206 0,0233 GAI099 (mm/°Cj) 0,1008 0,0407 GAI069 Vmax 0,0177 GAI039 0,0255 GAI060 (mm) 0,0934 0,0502 GAI069 Lmax R² global R² partiel SNP
Variables Variables SNP R² partiel R² global
0,0128 GAI048 0,0144 GAI114 0,0225 GAI069 (°Cj) 0,0838 0,0341 GAI051 Da 0,0245 GAI189 0,0122 GAI099 0,0174 GAI156 0,018 GAI114 0,0219 GAI048 (mm/°Cj) 0,1358 0,0418 GAI069 Vmax 0,018 GAI222 0,0252 GAI048 0,0295 GAI099 (mm) 0,1106 0,038 GAI069 Lmax Printemps Automne
Etude
d’association : Effet du SNP GAI069 9 -6 1 273 Da_pts 5 -6 -5 Da_aut 297 0,047 -0,019 0,081 1,507 Vmax_aut 0,059 -0,122 0,038 1,732 Vmax_pts 13 -17 -6 303 Lmax_aut 15 -27 5 312 Lmax_pts 1 / 2 2 / 2 1 / 1Effet des génotypes par rapport à la
moyenne Moyenne
Variables Conclusion :
Les hétérozygotes sont toujours supérieurs aux
homozygotes GAIx GAI069 + + _ _ 2 1 GAIx GAI069 _ + + _ 1 1 GAIx GAI069 + _ _ + 2 2 Avec : GAIx < GAI069 + dominant
>
>
Analyse de variance sur les groupes basés sur
un arbre phylogénétique a f e d c b g Hap2 Hap15 Hap10 Hap9 Hap30 Hap37 Hap27 Hap24 Hap25 0.52 0.04 0.04 3.3 f-g Vmax aut 0.50 0.04 0.03 3.2 e-f Vmax pr 0.30 0.02 0.04 4.1 f-g Vmax pr 0.16 0.007 0.06 5.1 c-d Vmax pr 0.41 0.03 0.04 3.7 c-d Lmax pr PMon Psim % var. F-stat Branch Trait
Etude d’association : comparaison des
3 méthodes
• Toutes ont tendance à faire ressortir l’effet de GAI069 Mais la régression sur les SNP semble plus puissante
– Pas de bruit de fond du à des SNP ayant des effets contraires présents dans le même haplotype
• L’analyse de variance sur les haplotypes peut être
intéressante si l’effet du gène est provoqué par plusieurs mutations
• L’analyse basé sur l’arbre phylogénétique est
intéressante si, au cours de l’évolution, il y a eu des mutations reverses ou des branches de l’arbre dans
lesquelles il n’y a pas de DL entre le SNP étudié et celui à l’origine de l’effet
Conclusion Partie 2
• GAI explique environ 10% des variations de longueur de feuilles dans la variété Herbie malgré le grand nombre de gènes candidats • Il intervient à la fois sur la durée et la vitesse
d’allongement foliaire
• Un SNP explique jusqu’à 5% de la variabilité des variables de longueur de feuilles étudiées
• Les SNP étudiés sont synonymes donc non directement impliqués
Conclusion générale
• Les variétés synthétiques peuvent être utilisées pour les études d’association
– “gène candidat” dans les variétés à base large
– “genome scan” dans les variétés à base étroite mais dans une région ciblée
• Nécessité de mesurer le DL dans la population et dans la région étudiée
Perspectives
• Obtenir la séquence complète du gène GAI pour identifier la ou les mutations
responsables des variations observées • Etudier l’effet de ce gène dans d’autres
populations
• Possibilité d’intégrer les études d’association dans les schémas de sélection en particulier pour les synthétiques
Références bibliographiques
Ardlie KG, Kruglyak L, Seielstad M (2002) Patterns of linkage disequilibrium in the human genome. Nat Rev Genet 3:299-309
Flint-Garcia SA, Thornsberry JM, Buckler ES (2003) Structure of linkage disequilibrium in plants. Annu Rev Plant Biol 54:357-374
Gupta PK, Sachin R, Kulwal P (2005) Linkage disequilibrium and association studies in higher plants: present status and future prospects. Plant Mol Biol 57:461-485
Pritchard JK, Stephens M, Donnelly P (2000) Inference of population structure using multilocus genotype data. Genetics 155:945-959
Pritchard JK, Stephens M, Rosenberg NA, Donnelly P (2000) Association mapping in structured populations. Am J Hum Genet 67:170-181
Stephens M, Donnelly P (2003) A comparison of Bayesian methods for haplotype reconstruction from population genotype data. Am J Hum Genet 73:1162-1169 Stephens M, Smith NJ, Donnelly P (2001) A new statistical method for haplotype reconstruction from population data. Am J Hum Genet 68:978-989
Verdenal A., Combes D., Escobar-Gutiérrez A.J. 2008. A study of ryegrass architecture as a self-regulated system, using functional-structural plant modeling. Functional Plant
Logiciels
• STADEN : vérification et alignement des séquences
(http://staden.sourceforge.net/ )
• BLAST sous NCBI : vérification de l’identité de la séquence par homologie avec
d’autres connues (http://blast.ncbi.nlm.nih.gov/Blast.cgi )
• DNAsp et TASSEL : calcul et test du DL gamétique (http://www.ub.edu/dnasp/
et
http://www2.maizegenetics.net/index.php?page=bioinformatics/tassel/index.html ) en plus calcul de l’indice de diversité π avec DNAsp
• PHASE : détermination de la phase entre locus à partir de données
génotypiques (http://www.stat.washington.edu/stephens/phase.html)
• GENETIX : calcul du nombre d’allèle, de l’hétérozygotie attendue et de l’indice
de fixation Fis (http://www.genetix.univ-montp2.fr/genetix/intro.htm)
• GENEPOP : test l’écart à l’équilibre d’Hardy-Weinberg, test du DL génotypique
(http://genepop.curtin.edu.au/)
• STRUCTURE : évaluation de la structuration des populations
(http://pritch.bsd.uchicago.edu/structure.html )
• SAS : analyses de variance, corrélations, régressions linéaire
(http://www.sas.com/technologies/analytics/statistics/stat/index.html )
• PHYLIP : détermination d’un arbre phylogénétique à partir des données de
séquences (http://evolution.genetics.washington.edu/phylip.html )
• Phylodraw : représentation graphique d’un arbre phylogénique
(http://pearl.cs.pusan.ac.kr/phylodraw/ )
• TREESCAN : recherche d’associations en prenant en compte l’arbre