• Aucun résultat trouvé

Chapitre I : Amélioration de la séquence de référence du génome du bananier

I.3 Assemblage partiel du génome mitochondrial du bananier

Le génome mitochondrial des angiospermes est de taille très variable, la majorité se trouvant entre 300 et 600 kb avec un minimum de 200 kb chez certaines Malvacées (Palmer, 1992) et un maximum pouvant dépasser les 1.5 Mb chez certaines Cucurbitacées (Alverson et al., 2011). Le génome mitochondrial des plantes se compose d’un set minimal de 26 gènes codant des protéines dont la majorité code pour des sous-unités des complexes de la chaîne respiratoire (Knoop, 2004). Bien que l’évolution des gènes mitochondriaux des angiospermes soit plus lente que celle des gènes nucléaires et chloroplastiques (Palmer and Herbon, 1988; Zhu et al., 2007), des variations importantes de la structure globale de la mitochondrie ainsi que de l’ordre des gènes ont été observées (Palmer and Herbon, 1988).

Le génome mitochondrial des plantes présente une structuration multipartite organisée en un ou plusieurs cercles d’ADN (D’Hont et al., 1987; Palmer, 1992). L’origine de ces différents cercles serait la présence de régions répétées qui, par des mécanismes de recombinaisons, entraîneraient la structuration du génome en plusieurs cercles d’ADN (Figure 16).

Une approche identique à celle réalisée pour l’assemblage du génome chloroplastique du bananier a été testée pour assembler le génome mitochondrial. Lors de cette tentative, le génome utilisé comme référence a été celui de Phoenix dactylifera (Fang et al., 2012). Cependant, la présence de séquences chloroplastiques (Fang et al., 2012) connues pour s’intégrer de manière récurrente dans le génome mitochondrial (Notsu et al., 2002; Palmer, 1992) a conduit à un envahissement de l’assemblage mitochondrial par le génome chloroplastique complet lors des étapes itératives. Cet envahissement est la conséquence de la combinaison de deux phénomènes : la récupération par recherche de similarité des séquences chloroplastiques présentes dans le génome mitochondrial, et un rapport déséquilibré en quantité de séquence en faveur du chloroplaste. Dans ces conditions, chaque fois qu’une séquence de chloroplaste est présente dans un contig mitochondrial, l’élongation consensus “penche” vers le chloroplaste et reconstruit le génome chloroplastique complet. L’utilisation de paramètres d’alignement et d’assemblage plus exigeants a permis de résoudre en partie ces problèmes d’envahissement du génome mais résulte en un assemblage très partiel. Cette approche n’a donc pas permis d’obtenir un assemblage satisfaisant du génome mitochondrial de bananier.

Par contre, lors des recherches d’hétérozygotie structurale chez ‘Pahang’, décrite dans le chapitre 2, plusieurs scaffolds de grande taille non ancrés aux chromosomes ont révélé des

142

Figure 17 : Représentation Circos simplifiée des couvertures de la banque de 5 kb obtenue par re-séquençage de l’accession ‘Pahang’. La couverture moyenne des lectures

pairées est calculée sur une fenêtre de 1 kb. La couverture moyenne est codée en utilisant le code couleur suivant : quand la couverture est supérieure à quatre fois la couverture attendue, une barre rouge est dessinée. Pour toute autre valeur un point coloré est dessiné. Les fenêtres présentant une couverture supérieure à 5/4, 4/3, 3/2 et 2 fois la couverture attendue sont représentées par un point vert clair, jaune, orange et rouge respectivement. Les fenêtres présentant une couverture inférieure à 3/4, 2/3 et 1/2 fois la couverture médiane attendue sont représentées avec des points verts foncés, bleus et bleus foncés respectivement. Les fenêtres présentant une couverture comprise entre 3/4 et 5/4 sont représentées par des points verts. L’étude des couvertures de la banque 5 kb générée sur ‘Pahang’ permet d’observer de grands scaffolds (blocks noirs et jaunes) présentant une couverture anormalement élevée (flèches rouge).

scaffolds non ancrés de la

première version de l’assemblage

(D’Hont et al 2012)

Couverture

143 couvertures anormalement élevées par rapport aux couvertures attendues (Figures 17). La recherche de similarités entre la séquence de ces scaffolds et la base de données nucléotidiques (‘Nucleotidique collection’) du National Center for Biotechnology Information (NCBI) a révélé comme seule similarité significative des gènes mitochondriaux. Ceci indique clairement l’appartenance de ces scaffolds au génome mitochondrial.

Finalement, les scaffolds mitochondriaux ont été recherchés et identifiés dans la nouvelle version de l’assemblage du bananier par similarité (BLAST) avec les 37 gènes mitochondriaux codant des protéines de Phoenix dactylifera (Fang et al., 2012). Tous les gènes mitochondriaux de Phoenix dactylifera ont pu être alignés sur des scaffolds de l’assemblage. L’appartenance de ces scaffolds au génome mitochondrial de la banane a été validée par deux tests:

1. Vérification par approche de similarité réciproque. Chaque scaffold identifié comme contenant un gène mitochondrial a été utilisé pour une recherche de similarité dans la base de données nucléotidiques complète du NCBI; le meilleur hit en dehors du genre Musa a été analysé et doit correspondre à une séquence mitochondriale.

2. Vérification que la couverture des lectures de ‘Pahang-HD’ sur ces scaffolds est homogène et plus élevée que l’attendu pour un scaffold ‘nucléaire’. Cette couverture, plus importante, est attendue et s’explique par la présence de plusieurs mitochondries par cellule contre un seul noyau. Dans notre cas, le ratio se situe aux alentours de quatre copies du génome mitochondrial pour une copie de génome nucléaire.

Tous les scaffolds dans lesquels des gènes mitochondriaux ont été identifiés ont été ainsi validés et assignés au génome mitochondrial. Ils ont ainsi pu être retirés de la partie non ancrée de la séquence de référence du génome nucléaire.

Finalement, 12 scaffolds mitochondriaux ont été identifiés. Leur taille cumulée est supérieure à 7.2 Mb avec une N50 de 616 kb et une taille allant de 172 kb à 3.77 Mb. L’ensemble des 12 scaffolds comprend 37.5kb (0.52%) de N.

Chez les angiospermes, aucun génome mitochondrial ne présente une taille aussi importante. Le génome mitochondrial du bananier serait environ quatre fois plus gros que le plus grand génome mitochondrial rapporté chez les angiospermes (Cucumis sativus, 1 685 kb). Des tailles similaires ont été observées chez des gymnospermes, Picea abies et Picea glauca avec des tailles respectives de 5.5 et 6 Mb (Jackman et al., 2014).

145 Pour finaliser cet assemblage, nous avons tenté d’isoler les mitochondries du bananier mais sans succès jusqu’à présent.

Un total de 24 marqueurs SSR a été développé sur la base de ces scaffolds mitochondriaux et a été testé sur cinq bananiers appartenant à l’espèce Musa acuminata et une accession des espèces Musa balbisiana et Musa boman. Parmi ces 24 marqueurs, 7 se sont révélés polymorphes intra Musa acuminata et 12 ont été identifiés polymorphes inter-espèces.

Chez le bananier, la transmission des génomes cytoplasmiques est particulière puisque, contrairement à la majorité des angiospermes où les deux organites (chloroplaste et mitochondrie) sont à hérédité maternelle, le chloroplaste est à hérédité maternelle alors que la mitochondrie est à hérédité paternelle (Fauré et al., 1994). Ces particularités font des marqueurs dérivés de ces organites un outil particulièrement intéressant en complément des marqueurs nucléaires, pour mieux comprendre l’origine des bananiers cultivés et pour vérifier et valider les croisements dans le cadre d’analyses génétiques ou de programmes d’amélioration.

Conclusion

A l’issue de ce travail, nous avons maintenant une meilleure connaissance des différents compartiments génomiques du bananier avec un draft de génome mitochondrial (sous la forme de douze scaffolds), un génome chloroplastique complet et une séquence de référence du génome nucléaire grandement améliorée. L’amélioration de cette séquence de référence du génome du bananier aura une répercussion importante sur la qualité des analyses et interprétations qui seront réalisées par la communauté scientifique sur la base de cette référence. Il sera, par ailleurs, intéressant d’analyser plus en détail le génome mitochondrial (structure, composition en séquences) qui semble avoir une structure particulière chez la banane.

147

Chapitre II : Développement d’outils pour la détection de