• Aucun résultat trouvé

CHAPITRE I : RECENSEMENT DES MEMBRES DE LA FAMILLE TaNAC CHEZ

2. Structuration phylogénétique et motifs conservés chez les gènes TaNAC

82

L’analyse des 488 séquences TaNAC protéiques par le prédicteur Phobius a montré que 18

protéines possèdent une hélice transmembranaire d’environ ~21 aa située dans leur partie

C-terminale. Seize de ces séquences appartiennent à la sous-famille NAC-b, les 2 séquences

restantes appartiennent à la sous-famille NAC-i. Une autre protéine (TraesCS3D01G329300.1)

possède un peptide signal de 19 aa en position N-terminale. Nous n’avons cependant pas

d’information concernant le compartiment auquel ce peptide pourrait adresser la protéine.

2. Structuration phylogénétique et motifs conservés chez les gènes TaNAC

Pour mieux comprendre les relations phylogénétiques entre les gènes TaNAC, nous avons

généré un arbre phylogénétique basé sur l'alignement des 488 séquences TaNAC protéiques

entières en utilisant la méthode du maximum de vraisemblance (Figure 45). Cet arbre

phylogénétique a mis en évidence des similarités entre séquences et a pu apporter des

renseignements sur les mécanismes évolutifs ayant permis le développement de cette famille.

Tout d’abord, cet arbre a montré un regroupement primaire des séquences sous forme de

groupes d’homéologie. Sur la base de l’alignement des séquences, 231 gènes TaNAC

appartenant aux génomes A, B et D ont été regroupés en 77 groupes d’homéologie complets

dans l’arbre phylogénétique. Ce résultat représente 47% du total des gènes TaNAC.

Quarante-huit autres groupes d’homéologie incomplets (ne comptant que 2 membres) ont été identifiés et

représentent 20% du total des gènes TaNAC. Enfin, 161 séquences n’ont pu être rattachées à

aucune séquence homéologue au sein de l’arbre.

La structuration de l’arbre phylogénétique en clades a aussi permis la création de plusieurs

sous-familles au sein de la famille TaNAC. Par alignement avec les sous-sous-familles NAC décrites par

Christiansen et al. (2011) chez l’orge et par Shen et al. (2009) chez le riz, Borrill et al. (2017)

avaient structuré la famille NAC de blé tendre en 8 sous-familles en fonction du regroupement

des séquences entre les clades de l’arbre phylogénétique. Cette classification a été adaptée aux

clades observés dans notre arbre phylogénétique. Les 488 séquences TaNAC ont donc été

réparties en 11 sous-familles, de NAC-a à NAC-k. Les sous-familles NAC-i (14 membres),

NAC-j (5 membres) et NAC-k (3 membres) ont été créées pour regrouper les séquences non

rattachées aux clades principaux.

Tableau 12 : Séquences TaNAC et leurs homologues chez T. urartu, le riz et le sorgo. Les 21

séquences possèdent toutes le même homologue chez le riz et 18 d’entre elles montrent aussi

un homologue identique chez le sorgho. De plus, certains de ces TaNAC sont ancrés côte à côte

sur la pseudomolécule de blé tendre (un exemple de 5 gènes dont les identifiants se suivent,

ancrés sur le chromosome 2B et surlignés en gras dans le tableau). Ces résultats appuient

l’hypothèse d’un élargissement de la famille NAC chez le blé tendre par rapport aux autres

céréales, par des mécanismes de duplications locales.

Séquences TaNAC Meilleur Hit

T. urartu Sorgho Riz

TraesCS2A01G326500.1

TuG1812G0200003836.01.P01

SB04G024780

OS02G38130

TraesCS2B01G355400.1

TraesCS2B01G355500.1

TraesCS2D01G336400.1

TraesCS2A01G326400.2

TuG1812G0200003837.01.P01

TraesCS2B01G355700.1

TraesCS2B01G355600.1

TraesCS2D01G336500.1

TraesCS2A01G325900.2

TuG1812G0700000325.01.P01

TraesCS2A01G326600.1

TraesCS2B01G355300.2

TraesCS2D01G336300.1

TraesCS6A01G208900.3

TuG1812G0600002466.01.P02

TraesCS6B01G237900.3

TraesCS6D01G192400.1

TraesCS2D01G435800LC.2

TuG1812G0200003841.01.P01

TraesCS2D01G436300LC.1

TraesCS2A01G326300.2 TuG1812G0200003833.01.P01

TraesCS7A01G208200.1

TuG1812G0700002206.01.P01 SB10G009670

TraesCS7B01G115400.1

TraesCS7D01G210600.1

83

Au sein de cet arbre phylogénétique, nous avons constaté que certains clades regroupent des

séquences présentant des similitudes de structure exon-intron. De plus, ces séquences sont

ancrées en clusters sur la pseudomolécule du blé. Ce constat nous a conduit à considérer la

possibilité que des phénomènes de duplication au sein de la famille TaNAC puissent être à

l’origine de l’apparition de ces séquences proches physiquement (localisation chromosomique)

et phylogénétiquement.

Par ailleurs, nous avons identifié 488 membres de la famille NAC chez le blé tendre, ce qui est

un nombre particulièrement élevé par rapport à ce qui a déjà été observé chez d’autres céréales

comme le riz (151 membres ; Nuruzzaman et al. 2010) ou le blé dur (168 membres ; Saidi et

al. 2017). Cette grande différence entre le blé et les autres céréales est partiellement expliquée

par la présence de 3 sous-génomes chez le blé tendre, mais pas uniquement. En effet, nous

avons conduit une comparaison entre le génome du blé tendre et celui de T. urartu, un proche

parent porteur du génome A

u

A

u

. Nous avons constaté, pour 51 séquences de T. urartu, qu’elles

ressortent chacune comme le meilleur homologue de 3 séquences TaNAC chez le blé, ce qui

est cohérent avec la ploïdie de ces 2 espèces (diploïde vs hexaploïde). Cependant, 70 séquences

TaNAC ne possèdent pas d’homologue chez T. urartu et dans de nombreux cas, une séquence

unique chez T. urartu est le meilleur homologue pour plus de 3 gènes chez le blé tendre. Par

exemple, la séquence TuG1812G0700002220.01.P02 de T. urartu est l’homologue de 15

TaNAC chez le blé tendre (Tableau 11). Ces 15 séquences appartiennent à un clade commun,

qui ne montre pas une structuration nette en groupes d’homéologie mais plutôt un regroupement

en sous-génomes. Nous retrouvons notamment 5 gènes TaNAC physiquement voisins sur le

chromosome 7A (TraesCS7A01G209100, TraesCS7A01G209200, TraesCS7A01G209300,

TraesCS7A01G209400 et TraesCS7A01G209500). Ces 5 séquences pourraient donc être issues

de duplications en tandem d’une séquence de départ, homologue au gène

TuG1812G0700002220.01.P02 chez T. urartu. Du fait de cette redondance, au total seules 110

séquences différentes de T. urartu ont été identifiées comme meilleurs homologues des 488

séquences TaNAC. Le blé tendre étant composé de 3 sous-génomes, une famille composée de

330 gènes serait attendue chez cette espèce si on se réfère aux séquences obtenues pour T.

urartu. Or, 488 – 330 = 158 séquences TaNAC restent excédentaires.

Le nombre de TaNAC surnuméraires est encore plus élevé si l’on réalise ce même travail avec

d’autres céréales comme le riz ou le sorgho (Tableau 12). En effet, dû au même phénomène de

redondance, seules 85 et 83 séquences uniques de ces 2 espèces sont identifiées comme

meilleurs hits des 488 séquences TaNAC. En conséquence, nous estimons que le nombre de

Figure 46 : Distribution des membres de la famille TaNAC le long des 21 chromosomes du

blé tendre. En utilisant leurs informations de localisation chromosomique, 451 séquences ont

été cartographiées sur les 7 chromosomes des 3 sous-génomes A (rouge), B (vert) et D (bleu).

Les 7 premières lettres des noms de séquence ont été supprimées pour plus de lisibilité ; par

exemple, 4B01G328600 fait référence à TraesCS4B01G328600, situé sur le chromosome 4B

conformément à l'annotation IWGSC. La position de chaque TaNAC peut être estimée à l'aide

des échelles à gauche. Les 2 cercles montrent les régions chromosomiques étudiées comme

exemple de duplication.

84

gènes TaNAC chez le blé tendre est élevé par rapport aux autres espèces végétales proches, et

que ceci serait dû en partie à la nature hexaploïde du blé mais serait aussi le résultat d’importants

événements de duplication chez cette espèce.