• Aucun résultat trouvé

Cartographie génétique et détection de QTL

Génotype 157 Bloc

3.4.2 Cartographie génétique et détection de QTL

Un test de Ȥ² a été réalisé afin de tester la distorsion de ségrégation des marqueurs dans les trois populations de cartographie du premier dispositif expérimental. En ce qui concerne les marqueurs AFLP, seuls ceux ayant une ségrégation 1 : 1 ont été retenus. Pour les deux dispositifs, la numérotation des GL a été faite en accord avec la carte de référence des Lolium (Jones et al. 2002b).

Afin de répondre aux différents objectifs, différentes approches ont été utilisées pour la cartographie génétique ainsi que pour la détection de QTL.

3.4.2.1 Première approche : cartographie et détection de QTL par parent

Cette première approche a été utilisée pour répondre au premier et au troisième objectif de la thèse et repose sur le premier dispositif expérimental. Dans le premier objectif, la détection de QTL a porté sur chacun des parents Némo A, Némo B et Némo H afin de détecter les allèles favorables. Dans le troisième objectif, la détection a porté sur le parent Némo F dans les trois populations de cartographie étudiées séparément dans le but d’évaluer l’effet du fond génétique sur la détection de QTL. Par la suite, cette détection de QTL par parent sera appelée « analyse par parent ».

La construction des cartes génétiques a été faite pour chacun des parents. Ainsi, pour chaque parent, Némo A, Némo B et Némo H d’une part et Némo F dans chaque population de

une carte cadre a été construite en supprimant certains marqueurs dans les régions fortement couvertes dans le but de créer une carte robuste avec un marqueur tous les 5 à 10 cM. Les marqueurs conservés dans la carte cadre ont été choisis en fonction de leur position et en fonction de leur faible nombre de données manquantes. Tous les marqueurs co-dominants non inclus dans la carte cadre ont été rajoutés sans modifier l’ordre de la carte cadre, en utilisant la fonction « Try » de Mapmaker. Cela a permis de faciliter la comparaison avec d’autres études. Les QTL ont été détectés en utilisant le logiciel QTL Cartographer version 2.5 (Basten et al. 2007). La méthode de Composite Interval Mapping (CIM) a été utilisée sur les six cartes cadres avec le modèle standard (model 6) et la méthode de régression Forward et Backward pour définir les co-variables. Les analyses ont été réalisées avec une fenêtre de 10 cM et un pas de 2 cM. Le seuil de détection de QTL pour chaque caractère étudié a été déterminé par 1 000 permutations (Churchill et Doerge 1994) en Interval Mapping (IM). Enfin, l’intervalle de confiance a été estimé par la méthode « LOD moins un » pour chaque QTL (Van Ooijen 1992). Dans ce logiciel, l’effet additif donné correspond à la différence des moyennes phénotypiques des deux classes alléliques pour un QTL donné. Afin d’avoir une comparaison directe avec les autres analyses, ces effets additifs calculés par QTL Cartographer ont été divisés par deux.

3.4.2.2 Deuxième approche : cartographie et détection de QTL au sein de populations multiparentales connectées

Cette approche permet la détection de QTL au sein de populations connectées les unes aux autres par des parents communs au sein d’un unique modèle. Cette approche sera nommée « analyse multipopulations connectées ». Elle a été appliquée dans les deux dispositifs expérimentaux pour répondre au premier et au deuxième objectif de la thèse. Elle permet un gain de puissance dans la détection de QTL mais peut induire un effet de dilution des QTL à effet faible (cf. Synthèse bibliographique). Dans ce modèle, il est fait l’hypothèse que l’effet d’un allèle d’un individu donné est identique quel que soit le croisement dans lequel il est présent.

Cette analyse requiert la construction d’une carte génétique représentative de toutes les populations de l’étude. Pour le premier dispositif, une carte génétique a été construite pour

Figure 14 : Schéma présentant le codage des marqueurs pour deux croisements théoriques entre les parents P1 et P2 d’une part et les parents P1 et P3 d’autre part, ainsi que la détermination de la phase pour trois marqueurs. Dans MCQTL, le codage de chaque marqueur pour chaque croisement est indiqué de la manière suivante : « <..x..> ». Le codage <abxcd> doit être donné lorsque les deux parents sont hétérozygotes au marqueur étudié et qu’ils ne partagent pas d’allèle en commun. <abxac> correspond à un codage pour deux parents hétérozygotes au marqueur étudié partageant un allèle commun « a ». Enfin, le codage « aaxab » est donné lorsque le premier parent est homozygote tandis que l’autre parent est hétérozygote au marqueur considéré. Le code « a », « b », « c » ou « d » ne correspond donc pas systématiquement au même allèle. Prenons le cas du parent P1. Dans le croisement avec le parent P2, pour le marqueur 1, l’allèle 211 est codé « a » et l’allèle 213 est codé « b » car le parent est hétérozygote pour ce marqueur et le parent P2 est également hétérozygote mais ils ne partagent pas d’allèle en commun. Dans le croisement avec le parent P3, les deux parents sont hétérozygotes mais ils partagent un allèle commun, l’allèle 213. Cet allèle aura donc le code « a » et chez le parent P1 l’allèle 211 aura le code « b ». Ainsi entre les croisements P1 x P2 et P1 x P3 le code attribué aux allèles 211 et 213 du parent P1 n’est pas le même. Pour que le logiciel MCQTL puisse faire correspondre les codes des mêmes allèles chez un parent commun à différents croisements, il est nécessaire de déterminer la phase. Elle est indiquée de la manière suivante : {00}, {01}, {10} ou {11}. Le premier chiffre correspond à la phase du premier allèle du marqueur chez le premier parent considéré et le second correspond à celle du premier allèle du marqueur chez l’autre parent. Dans le cas du croisement P1 x P2, pour le parent P1, la phase pour les trois marqueurs considérés est la même (notée 0), c’est-à-dire que les allèles portant les codes « a » au marqueur 1, « a » au marqueur 2 et « a » au marqueur 3 sont situés sur le même chromosome homologue. Par conséquent, les trois autres

DĂƌƋƵĞƵƌϭ DĂƌƋƵĞƵƌϮ DĂƌƋƵĞƵƌϯ Ϯϭϭ Ϯϭϯ ϯϰϳ ϯϰϵ Ϯϲϭ ϮϳϬ

Ϯϭϳ ϮϮϬ ϯϰϮ ϯϰϮ Ϯϲϭ Ϯϲϴ

DĂƌƋƵĞƵƌϭ͗фĂďdžĐĚх΂ϬϬ΃ DĂƌƋƵĞƵƌϮ͗фĂďdžĂĂх΂ϬϬ΃ DĂƌƋƵĞƵƌϯ͗фĂďdžĂĐх΂ϬϬ΃ Ă Ă Ă ď ď ď Đ Ă Ă Ě Ă Đ WŚĂƐĞĚƵŵĂƌƋƵĞƵƌ ĐŚĞnjWϮ WŚĂƐĞĚƵŵĂƌƋƵĞƵƌ ĐŚĞnjWϭ Ϯϭϭ Ϯϭϯ ϯϰϳ ϯϰϵ Ϯϲϭ ϮϳϬ

Ϯϭϯ ϮϮϬ ϯϰϱ ϯϲϬ Ϯϱϴ ϮϳϬ

Ă Đ Đ Đ Ě Ă ď Ă ď Ă ď Ă DĂƌƋƵĞƵƌϭ͗фĂďdžĂĐх΂ϭϬ΃ DĂƌƋƵĞƵƌϮ͗фĂďdžĐĚх΂ϬϬ΃ DĂƌƋƵĞƵƌϯ͗фĂďdžĂĐх΂ϭϭ΃ ŽĚĂŐĞƉŽƵƌ DYd> WŚĂƐĞĚƵŵĂƌƋƵĞƵƌ ĐŚĞnjWϯ WŚĂƐĞĚƵŵĂƌƋƵĞƵƌ ĐŚĞnjWϭ

cartographie. La phase de chaque parent a été déterminée au cours de cette étape. La phase correspond à l’organisation des allèles sur les chromosomes homologues. La détermination de la phase est nécessaire car elle permet de lier les trois populations grâce au parent commun qui doit avoir une phase cohérente dans les trois populations (Figure 14). Pour les trois croisements, tous les GL étaient formés à un LOD score de 5. Puis, une carte consensus des trois cartes a été construite en se servant de la fonction « Combine maps ». Une carte cadre a été réalisée en supprimant certains marqueurs dans les régions fortement couvertes dans le but de créer une carte robuste avec un marqueur tous les 5 à 10 cM. Toutefois, les marqueurs SSR et/ou STS génotypés dans les trois croisements ont tous été gardés afin d’avoir de meilleurs liens entre cartes.

Pour la cartographie dans le second dispositif, nous avons procédé par famille de demi-frères afin d’avoir des effectifs corrects (Tableau 10), car la cartographie dans des populations de plein-frères contenant au plus 28 individus est impossible (Tableau 7). De plus, afin d’avoir plus d’informations de recombinaison, les données de marquage du premier dispositif expérimental ont été utilisées pour les parents Némo A, Némo B et Némo H. Ces informations ont été précieuses pour déterminer la phase des marqueurs communs chez ces trois parents. Pour les trois autres parents, Némo C, Némo D et Némo G, la détermination de la phase a été plus délicate voire impossible dans certains cas, ce qui a généré de nombreuses données manquantes. Pour chacun des parents du polycross, tous les groupes étaient formés à un LOD supérieur ou égal à 3. Finalement, une carte consensus a pu être construite avec le logiciel JoinMap en se reposant principalement sur les cartes de Némo A, Némo B et Némo H. Pour les deux dispositifs expérimentaux, la fonction de Haldane a été utilisée pour le calcul des distances entre marqueurs et les cartes ont été dessinées avec le logiciel Mapchart 2.1 (Voorrips 2002).

Pour la détection de QTL dans chacun des deux dispositifs, le logiciel MCQTL (Jourjon et al. 2005) avec le module Outbred pour les plantes allogames a été utilisé. L’analyse qui permet de « connecter » les différentes populations grâce au(x) parent(s) commun(s) a été choisie (Billotte et al. 2010). Le modèle additif de cette analyse a été utilisé dans les deux expérimentations tandis que le modèle de dominance n’a été appliqué que dans

Tableau 10 : Nombre de descendants pour chaque parent qu’il soit mâle ou femelle, dans le second dispositif expérimental.

Parents Némo A Némo B Némo C Némo D Némo G Némo H

Nombre d’individus par

15 cM autour du QTL présumé ainsi que la méthode « forward stepwise » pour la sélection des cofacteurs génétiques pour l’ensemble du génome. Le seuil de détection des QTL a été déterminé grâce à un test de Fisher sur l’ensemble du génome avec 10 000 permutations (Churchill et Doerge 1994) pour chacun des caractères. Des valeurs de seuil F très similaires ont été trouvées pour l’ensemble des variables et pour lesquelles la moyenne se situait autour de 3 pour un risque de 5% (Premier dispositif expérimental : 2,93 – 3.02 ; Second dispositif expérimental : 2,90 – 3,03). Il s’agit donc de la valeur seuil utilisée pour réaliser la détection de QTL. Les paramètres du modèle ont été estimés pour chaque QTL significatif : position, intervalle de confiance LOD–1, pourcentage de variance phénotypique expliquée, effet des allèles pour chacun des parents. Le pourcentage de variance expliquée calculé dans cette analyse multipopulations connectées inclut les effets de l’ensemble des parents de la population et ne peut donc pas être comparé à celui calculé par QTL Cartographer qui ne considère l’effet que d’un parent (comparaison des deux méthodes réalisée dans le cas du premier objectif). Pour un QTL donné, la somme des deux effets alléliques de chacun des parents est nulle par contrainte du modèle et les effets alléliques du parent commun (Némo F) sont considérés comme étant les mêmes dans toutes les populations. Pour chaque GL, les effets ont été calculés par rapport au même chromosome homologue pour tous les QTL. Enfin, des tests de Student ont été utilisés pour tester la significativité des additifs et de dominance pour chacun des QTL avec une erreur de type I de 5%. Pour chaque parent, l’effet additif d’un QTL donné a été testé grâce à la formule suivante :

࢚ ൌ ࢻ࢏െ ࢻ࢐ ටࢿ ȉ ሺ࣌൅ ࣌ ࢐ ૛െ ૛ࢉ࢕࢜ሺ࢏ǡ ࢐ሻሻ ൌ ૛ࢻ࢏ ට૛ࢿ ȉ ሺ࣌െ ࢉ࢕࢜ሺ࢏ǡ ࢐ሻሻ

avec Įi l’effet additif de l’allèle i, Įj l’effet additif de l’allèle j, İ la variance résiduelle du

modèle, ı²i la variance de l’effet de l’allèle i et ı²j la variance de l’effet de l’allèle j. Pour

chacun des croisements, l’effet de dominance a été testé grâce à la formule suivante :

࢚ ൌ ࢾ

ටࢿ ȉ ࣌

avec į l’effet de dominance, İ la variance résiduelle du modèle et ı²į la variance de l’effet de

3.4.2.3 Troisième approche : cartographie et détection de QTL au sein d’une seule population

Cette approche permet la détection de QTL au sein d’une population de cartographie en tenant compte des quatre allèles des deux parents (classes génotypiques). Elle a été utilisée pour répondre au troisième objectif sur l’effet du fond génétique sur la détection de QTL. Des détections de QTL au sein des croisements Némo A x Némo F, Némo B x Némo F et Némo H x Némo F ont été réalisées afin de comparer les QTL détectés chez Némo F dans ces trois fonds génétiques. Cette approche sera appelée « analyse simple population » par la suite.

La carte consensus des trois populations du premier dispositif expérimental a été utilisée pour faire la détection de QTL. Pour cette dernière, le logiciel MCQTL a été utilisé. Les mêmes options que pour l’analyse multipopulations connectées ont été utilisées mais en choisissant le modèle permettant l’analyse simple population. Contrairement à l’analyse multipopulations connectées, les effets alléliques du parent Némo F intervenant dans trois croisements peuvent être différents. Seul le modèle additif a été utilisé car nous avions constaté que les effets de dominance étaient faibles dans les résultats du premier objectif.

Tableau 11 : Statistiques élémentaires des trois croisements pour les variables étudiées.

Variables Unité Croisements Moyennea Minimum Maximum Ecart-type

Ro0807 1 : résistant à 9 : sensible AxF 3,27 b 1 9 1,64 BxF 4,47 a 1 9 1,64 HxF 3,22 b 1 9 1,79 Ht0907 mm AxF 238 b 160 333 43 BxF 258 a 158 353 47 HxF 232 b 141 320 39,9 Ht1107 mm AxF 199 a 116 279 37,1 BxF 187 b 123 249 32 HxF 190 b 122 249 30,2 Ht0408 mm AxF 142 b 90 206 21,7 BxF 147 a 99 195 22,5 HxF 138 b 91 191 22,1 Ht0508 mm AxF 242 b 179 300 27,1 BxF 251 a 196 300 26,6 HxF 240 b 178 300 32 VC08 mm/(°Cjour) AxF 0,46 b 0,31 0,62 0,07 BxF 0,48 a 0,33 0,64 0,08 HxF 0,46 b 0,27 0,65 0,09 Ht1108 mm AxF 141 ab 93 187 20,8 BxF 143 a 105 179 17,5 HxF 138 b 89 187 22 Ht0509 mm AxF 202 a 148 255 21,4 BxF 200 a 155 242 20,1 HxF 197 a 144 243 22,8

a Les valeurs suivies par la même lettre ne sont pas significativement différentes d’après le test de Student-

Documents relatifs