• Aucun résultat trouvé

B. 8. La sélection génomique pour les espèces pérennes et le palmier à huile

Chapitre III. REVUE BIBLIOGRAPHIQUE

III. B. 8. La sélection génomique pour les espèces pérennes et le palmier à huile

L’utilisation de la SG pour les espèces pérennes a été traitée en détail dans deux articles de revue (Grattapaglia, 2014; Isik, 2014). Pour le palmier à huile, une seule étude a été publiée (Wong et Bernardo, 2008). Ces publications sont reprises dans les introductions des articles constituant le Chapitre V et le Chapitre VI.

La principale difficulté commune à l’amélioration des espèces pérennes est la longueur de l’intervalle de génération. Par ailleurs, les évaluations au champ sont généralement coûteuses et complexes à réaliser, nécessitant de grandes superficies et une main d’œuvre importante pendant de nombreuses années (5-20 ans). Le principal intérêt de la SG serait donc de raccourcir l’intervalle de génération en permettant la sélection d’individus sans avoir à les évaluer. Selon les espèces, la SG pourrait aussi augmenter l’intensité de sélection et augmenter la précision de sélection chez les individus évalués. Chez le palmier à huile, les dispositifs expérimentaux permettent d’avoir des estimations fiables des AGC parentales avec le modèle mixte traditionnel, sans marqueurs (précision de sélection estimée à 0.9 au Chapitre IV). Les paramètres sur lesquels on essayera de faire agir la SG pour accroitre le rythme du progrès génétique sont donc l’intervalle de génération (actuellement 20 ans) et la faible intensité de sélection (actuellement moins de 200 individus testés en croisement par groupe parental et par génération, parmi les quelques milliers disponibles). Par rapport à beaucoup d’espèces pérennes, le palmier à huile se distingue par un petit nombre d’individus évalués (petites populations d’apprentissage pour la SG) et par un déséquilibre de liaison fort.

Wong et Bernardo (2008) ont comparé par simulations la sélection phénotypique classique, la MARS (sélection récurrente assistée par marqueurs, basée sur la détection de QTL) et la SG en termes de réponse à la sélection chez le palmier à huile. Ils ont simulé une petite population (60 à 140 individus) issue de l'autofécondation d'un croisement entre lignées

pures. Dans la première génération, ces individus ont été croisés avec un testeur puis sélectionnés sur leur valeur en croisement. Les meilleurs sont ensuite recombinés entre eux pour produire la génération suivante. Pour la sélection phénotypique cette procédure est répétée dans le cycle suivant. Pour la MARS et la SG, cette population initiale est génotypée et utilisée pour estimer des effets associés aux marqueurs. Pendant les trois cycles suivants (soit un total de quatre cycles, équivalents en nombre d’années aux deux cycles d’amélioration classique), la sélection est faite uniquement sur les marqueurs. Dans la MARS, les auteurs détectent parmi 100 marqueurs ceux qui sont significativement associés à des QTL. Pour la SG, 140 marqueurs sont utilisés. Finalement, la SG donne les meilleurs résultats en termes de gain génétique par unité de coût et par an (Figure 14). Cependant, ces simulations sont basées sur des hypothèses fortes, qui font que la population utilisée pour calibrer le modèle de SG est très différente des populations parentales qui existent dans les programmes d’amélioration du palmier à huile, beaucoup plus complexes (cf III. A. 3. c).

CONCEPTION DES ETUDES REALISEES DANS LA THESE

Les études réalisées au cours de cette thèse ont été planifiées sur la base des caractéristiques biologiques du palmier à huile, de son schéma d’amélioration, des données disponibles et des informations de la littérature présentées dans la revue bibliographique.

Les données disponibles étaient les observations phénotypiques faites dans un dispositif expérimental visant à tester en croisement 146 individus A et 156 individus B appartenant aux populations d’amélioration de PalmElit et de ses partenaires (SOCFINDO, CRAPP), acquises avant la thèse. Ces individus ont été génotypés avec 265 SSR au CIRAD, une tâche qui s’est achevée au début de la thèse. Mon travail sur les données moléculaires s’est limité à vérifier leur qualité, repérer les données suspectes (notamment sur la base d’incohérences par rapport à la généalogie) puis à effectuer des relectures. Ces données phénotypiques et moléculaires ont été utilisées pour caractériser les populations d’amélioration (Chapitre IV) et pour l’étude empirique de la précision de la SG (Chapitre V). Afin d’étendre l’étude au-delà de ce qui pouvait être traité avec les données expérimentales et de répondre à certaines questions soulevées par les résultats empiriques, des simulations ont été réalisées (Chapitre VI).

La caractérisation des populations d’amélioration (Chapitre IV) avait plusieurs objectifs. Elle visait tout d’abord à estimer les paramètres génétiques susceptibles d’influencer la précision de la SG (Chapitre V). Les paramètres retenus ont été ceux présentés dans la revue bibliographique : la taille efficace (Ne) des populations, l’héritabilité des caractères (h²) et l’apparentement entre les individus au sein de chaque groupe parental. Elle a aussi servi à estimer les AGC des parents, utilisées pour calibrer le modèle de SG et pour en mesurer la précision (Chapitre V). Enfin, certains paramètres génétiques (différentiation génétique (FST), variances génétiques additives pour le nombre de régimes (NR) et leur poids moyen (PM) et corrélation génétique additive entre NR et PM) ont servi à calibrer de manière pertinente les simulations du Chapitre VI, en plus d’autres paramètres obtenus dans la littérature.

La revue bibliographique a permis d’identifier les facteurs à faire varier dans l’étude empirique de la précision de la SG (Chapitre V), car susceptibles d’influencer les résultats : méthode statistique d’analyse du modèle de SG, caractéristique des populations d’apprentissage et de validation (apparentement entre elles et optimisation de la population d’apprentissage), population et caractères d’intérêt (compte tenu de la variabilité de h² et en supposant une diversité d’architecture génétique entre caractères et populations). Enfin, la revue bibliographique a aidé à définir l’étude par simulation, en particulier avec la publication de Kinghorn et al. (2010) qui présente la sélection génomique récurrente réciproque.

CHAPITRE IV. ETUDE PRELIMINAIRE : CARACTERISATION DES