• Aucun résultat trouvé

Chapitre 7 : Discussion et perspectives

7.1. Structuration des ressources génétiques de tomate, intérêts et limites des SSR

7.1.1. Aujourd’hui, les marqueurs SSR…

Un des premiers freins à l‟utilisation des ressources génétiques de tomates cultivées et sauvages proches était le manque de connaissance sur la structuration génétique de ces ressources génétiques. Les marqueurs SSR représentaient jusqu‟à maintenant des marqueurs de choix pour l‟étude de la diversité génétiques de populations naturelles ou de ressources génétiques. En effet, ils peuvent être multiplexés facilement, sont peu coûteux et peuvent être analysés automatiquement grâce à l‟utilisation de fluorochromes. Leur nature multi-allélique offre un pouvoir discriminant des individus beaucoup plus élevé que des marqueurs de type bi-allélique. Cependant, il semble nécessaire de bien prendre en compte la nature des motifs microsatellites dans le choix des différents marqueurs car elle peut influer sur la diversité potentielle que peut offrir le marqueur en termes de nombre d‟allèles. Par exemple nous avons montré que des motifs répétés riches en A et en T présentent des taux de mutations plus élevés que les marqueurs riches en G et en C ou les marqueurs mixtes. Ces marqueurs seront donc très intéressants pour étudier les relations entre individus au sein de populations présentant une faible diversité génétique. Ce très fort taux de mutation peut néanmoins présenter certains inconvénients. Le plus important est sans doute l‟homoplasie, cas où deux alléles de deux individus peuvent être identiques par état mais pas par descendance (Curtu, Finkeldey et al.

2004). En effet deux allèles ancestraux différents ont plus de chance de donner dans leur généalogie des allèles identiques si leur taux de mutation est élevé. Plusieurs modèles évolutifs ont été décrits pour les marqueurs microsatellites mais deux d‟entre eux semblent avoir reçu plus d‟attention. Le plus simple est le modèle dit d‟allèle infini (Infinite Allele Model) qui décrit chaque allèle différent comme issu d‟un seul évènement d‟addition ou d‟élimination d‟une ou plusieurs répétitions. L‟autre modèle, le Step-Wise Mutation Model (SMM) décrit comment un allèle de longueur n répétitions peut être issue de l‟allèle n-x ou

n+x avec x le nombre de répétitions ajoutées ou éliminées. La prise en compte d‟un tel modèle

permet de dresser non plus une étude de la diversité des individus mais une étude phylogénétique de ceux-ci car on peut retracer l‟histoire évolutive de chaque allèle et caller une notion de temps sur les branches séparant deux individus. Ici, la nature des allèles identifiés n‟a pas permis d‟utiliser le modèle SMM. En effet, les pas de mutation n‟ont pas été respectés pour aucun des marqueurs. Une part de la variation de la longueur des allèles est provoquée par des mutations dans la séquence flanquant le motif. Ces marqueurs n‟ont donc pas pu retracer la phylogénie des accessions.

Les marqueurs microsatellites les plus utiles pour une espèce peu polymorphe sont les marqueurs possédant de nombreuses répétitions (supérieures à 30). Ces marqueurs offrent un niveau de variabilité supérieur mais se regroupent en clusters près des centromères (Areshchenkova and Ganal 1999). Cette propriété empêche leur utilisation si l‟étude vise à échantillonner une grande part du génome.

Les marqueurs SSR ont été des marqueurs de choix pour les études de diversité car parce qu‟ils sont multi-alléliques, basés sur la PCR, reproductibles et sélectivement neutres. Cependant, avec une densité sur le génome beaucoup plus grande, un taux de mutations plus faible et le développement de techniques « haut-débit », les SNP sont en train de devenir des marqueurs de choix pour de telles études.

7.1.2. Demain, les SNP…

Un set de marqueurs SNP a été défini au cours de la thèse mais les résultats de génotypage ne sont pas encore disponibles. Une « core collection » de 24 accessions a été utilisée pour identifier du polymorphisme dans les introns de gènes candidats. Les polymorphismes détectés, ainsi que les SNP récupérés dans la bibliographie (van Deynze, Stoffel et al. 2007) sont venus incrémenter la collection de SNP identifiés sur les 96

accessions afin de construire quatre panels SNPlex® (Gut 2001), constitués de 48 SNP ou Indel chacun. Tous ces polymorphismes sont en cours de génotypage sur la collection totale d‟Avignon. Ces polymorphismes forment un panel d‟intérêt pour ré-analyser la structure de l‟échantillon. Avec un taux de données manquantes d‟environ 20% déjà observé, nous aurons plus de 150 marqueurs bi-alléliques à notre disposition, répartis sur le génome. Ces marqueurs sont potentiellement neutres car ils ont été détectés dans les introns et les régions intergéniques. Les résultats pourront être comparés à ceux déterminés par le génotypage des marqueurs SSR. De plus, tous ces SNP ont été choisis sur la base de leurs fréquences alléliques dans l‟échantillon de 24 accessions. Très peu d‟allèles rares, moins informatifs, ne devraient se trouver dans ce panel.

7.1.3. La structure de la collection de 340 tomates cultivées et sauvages proches.

Le génotypage de 20 marqueurs SSR a permis d‟analyser la structuration de la diversité présente dans l‟échantillon de 340 accessions. Le logiciel STRUCTURE (Pritchard, Stephens et al. 2000), couplé à la méthode d‟Evanno (2005), a permis de déterminer la structuration la plus probable de la collection. La structuration identifiée avec cette méthode était cohérente à celle identifiée par l‟analyse en coordonnées principales (ACoP) qui se base sur la dissimilarité entre individus pris deux à deux. Ces deux méthodes sont complémentaires car, alors que l‟une donne des résultats de probabilité d‟appartenance de chacune des accessions à une population, l‟autre montre bien l‟écart existant entre les populations et la diversité génétique intrinsèque à chacune des populations. D‟autres méthodes d‟analyses bayesiennes sont disponibles pour la communauté scientifique pour étudier la structure génétique à partir de marqueurs moléculaires (Holsinger, Lewis et al. 2002; Corander, Waldmann et al. 2003; Corander, Waldmann et al. 2004; Holsinger and E. 2004). Ces méthodes n‟ont pas été testées ici mais peuvent présenter certains avantages, comme le fait de ne pas forcer de structure lorsque celles-ci n‟existent pas (Corander, Waldmann et al. 2003), ce qui n‟est pas le cas de STRUCTURE.

Le premier niveau de structuration sépare les accessions domestiquées des accessions sauvages. Le deuxième niveau de structuration permet de séparer les accessions portant de gros fruits des accessions portant de petits fruits parmi le pool domestiqué. La structure est ici fortement corrélée avec un caractère d‟intérêt pour la domestication et l‟agriculture moderne. La sélection exercée par l‟homme explique sûrement cette structure.

7.1.3.1. La structuration chez S. pimpinellifolium semble être expliquée par des différences du taux d’autogamie des accessions.

Le deuxième niveau de structuration différencie deux populations d‟accessions sauvages. La seule différence trouvée entre ces deux populations est le taux de fleurs possédant des styles introrses dans le cône d‟étamines. Ce caractère témoigne du taux potentiel d‟intercroisement. Le groupe A qui présente 100% de fleurs brévistyles (donc fortement autogames) possède une diversité génétique plus faible que la population B, où 50% des accessions ont des fleurs longistyles. Un des locus contrôlant l‟insertion du style chez la tomate a été cloné (Chen, Cong et al. 2007). STYLE2.1 code pour un facteur de transcription qui régule l‟élongation des cellules dans le style en développement. Il serait intéressant d‟étudier les traces de sélection autour de ce gène pour les deux groupes d‟accessions sauvages afin de vérifier s‟il y a eu ou pas sélection pour le passage à l‟autogamie d‟une partie des accessions sauvages. Etant donné que le phénotype est fortement lié à l‟environnement ces informations sont à prendre néanmoins avec beaucoup de précautions.

Il semble aussi intéressant d‟augmenter le nombre d‟accessions S. pimpinellifolium dans les analyses futures, étant donné sa proximité génétique avec la tomate cultivée. Cette espèce a sans doute été le point de départ de la domestication de la tomate, contrairement à ce qui est admis par Rick (1976), qui postule qu‟il s‟agit d‟une espèce indépendante.

7.1.3.2. Les accessions de type cerise présentent une position « admixture » originale.

L‟étude de la structure génétique de la collection permet aussi d‟observer une différence entre les accessions de type cerise qui se regroupent dans une population proche des accessions de type gros fruits et les accessions de même type qui dessinent un continuum entre le compartiment sauvage et le compartiment cultivé. Ceci apporte la preuve qu‟il y a eu deux histoires complètement différentes dans l‟évolution de la tomate cerise. Une hypothèse probable est que la domestication à partir de S. pimpinellifolium a entraîné une réduction drastique de la diversité génétique de la tomate, au début de sa culture par l‟homme. Les premières accessions utilisées devaient présenter une taille de fruit relativement réduite équivalente aux fruits de tomate de type cerise. L‟homme a continué à sélectionner la tomate jusqu‟à ce que la taille du fruit augmente. Lorsque les conquistadors envahissent le Mexique, ils rapportent avec eux quelques accessions avec des fruits moyens à gros. Les premières représentations, dessinées en Europe, montrent des fruits fasciés relativement gros. Ceux-ci

seront encore sélectionnés en Europe puis aux Etats-Unis jusqu‟à donner des tailles de fruits extrêmes. Les accessions de type cerise qui existaient à l‟état sauvage au Mexique et dans la cordillère des Andes ont continué à s‟intercroiser librement avec des accessions cultivées et des accessions sauvages dans des zones de sympatrie. D‟autres accessions de type cerise ont continué à être utilisées comme variétés locales. L‟histoire de la tomate cerise n‟est donc pas simplement celle d‟une forme transitoire entre les formes cultivées et les formes sauvages. Des intercroisements récurrents entre les différentes formes ont eu lieu tout au long de son histoire.

Le continuum formé par les accessions S. l. cerasiforme apporte une diversité génétique qu‟on croyait présente uniquement chez l‟espèce sauvage. En plus d‟une diversité génétique importante, ces accessions possèdent une grande variabilité au niveau phénotypique. Les accessions sauvages ne présentent pas de diversité morphologique pour la taille du fruit, ce caractère, qui sépare l‟espèce sauvage de l‟espèce cultivée et fait partie du syndrome de domestication.

7.1.3.3. Le nombre de marqueurs SSR est insuffisant pour mettre en évidence une structuration des accessions cultivées.

Aucune structure génétique n‟a pu être identifiée au sein du groupe cultivé moderne. Un plus grand nombre de marqueurs SSR hautement polymorphes serait nécessaire. Chez le maïs, qui est l‟espèce modèle pour les études sur la diversité génétique des plantes cultivées, pas moins de 99 marqueurs SSR sont utilisés pour détecter la structure génétique de l‟échantillon. Une autre étude de diversité chez la tomate, basée sur l‟utilisation de SNP, montre qu‟il existe une différenciation génétique entre des accessions cultivées de frais, des accessions cultivées d‟industries, des variétés anciennes, des variétés mexicaines et des accessions sauvages (S. pimpinellifolium) (Sim, Robbins et al. 2009). Cette étude est réalisée en considérant la structure génétique avec a priori. Il serait intéressant d‟utiliser ce panel de SNP sur la collection d‟accessions cultivées d‟Avignon afin de valider cette structure à partir du modèle Bayesien implémenté dans STRUCTURE.

7.1.4. Construction de « core collections » emboîtées.

L‟échantillonnage des « core collections » a été volontairement focalisé sur les accessions appartenant au groupe botanique des S. lycopersicum var. cerasiforme. Certains individus de type sauvage S. pimpinellifolium, ainsi que du type cultivé, S. lycopersicum var

esculentum ont été rajoutés afin de pouvoir déterminer l‟origine de chaque allèle.

L‟échantillonnage a été réalisé séparément sur chaque espèce car, lorsque la collection totale est utilisée, une grande part de la « core collection » est constituée par des accessions sauvages. Lorsque cette « core collection » de 96 individus a été échantillonnée, les résultats de STRUCTURE n‟étaient pas encore disponibles. Il serait intéressant de ré-échantillonner une « core collection » à partir des 340 accessions en indiquant en co-variable, le degré d‟appartenance à chacune des sous-populations, indiqué par STRUCTURE,pour que ce nouvel échantillon représente au mieux la structuration initiale.

Etant donné le faible polymorphisme identifié chez la tomate, on s‟attendait à ce que l‟échantillonnage d‟individus représentant la collection totale à l‟aide de MSTRAT présente un gain substantiel par rapport à un échantillonnage aléatoire (Bataillon, David et al. 1996). Ce gain dans la procédure d‟échantillonnage est apporté majoritairement par les marqueurs moléculaires et beaucoup moins avec les caractères phénotypiques.

Les « core collections » emboîtées représentent une nouvelle ressource disponible pour toute la communauté scientifique s‟intéressant à l‟étude de la diversité chez la tomate avec des objectifs divers et variés : détection de polymorphisme, histoire évolutive, domestication, détection de QTL, diversité de gènes d‟intérêt.

7.1.5. Les « core collections » dans la découverte de gènes d’intérêt.

Ces « core collections » sont nécessaires pour mieux utiliser la diversité génétique naturelle présente dans les collections de ressources génétiques. Elles représentent un échantillon de taille moyenne permettant d‟assurer une puissance statistique confortable tout en se concentrant sur un nombre relativement restreint d‟individus. De nombreuses « core collections » ont été établies auparavant chez A. thaliana, M. truncatula et la vigne (vitis

vinifera) et les résultats d‟intérêt qu‟on leur doit ne sont plus à débattre (McKhann, Camilleri

et al. 2004; Ronfort, Bataillon et al. 2006; Le Cunff, Fournier-Level et al. 2008). Des analyses de diversité réalisées sur la « core collection » échantillonnée pour A. thaliana ont permis de mettre en évidence une structure régionale au niveau de populations européennes (Ostrowski, David et al. 2006). Les auteurs montrent que cette structuration engendre un déséquilibre de liaison significatif entre marqueurs non liés, ce qui engendrera un fort taux de faux positifs dans le cas d‟études d‟associations, si elle n‟est pas prise en compte. Sur la vigne, la « core collection » de 141 individus a permis d‟identifier des polymorphismes dans des facteurs de

transcription de la famille des Myb associés à le teneur en anthocyane dans les baies de raisin qui est responsable de la coloration de celles-ci (Fournier-Level, Le Cunff et al. 2009).

7.2. Potentiels et limites de l’analyse d’association chez la tomate, une