• Aucun résultat trouvé

CHAPITRE I : RECENSEMENT DES MEMBRES DE LA FAMILLE TaNAC CHEZ

4. Diversité allélique au sein de la famille TaNAC

87

TraesCS4D01G325700 et TraesCS4B01G328900) à 0,83 (entre TraesCS4D01G325800 et

TraesCS4D01G325700). En revanche, les corrélations sont plus élevées en réponse aux stress,

leurs valeurs variant de 0,77 à 0,94 (Figure 51). Collectivement, ces résultats indiquent que les

membres de cette duplication présentent des profils d'expression similaires en réponse aux

stress abiotiques testés, mais cette corrélation entre gènes est moins importante pendant le

développement. Ce constat peut être illustré par le comportement des 2 paralogues

TraesCS5A01G500700 et TraesCS4B01G328900 (encadrés sur la Figure 51).

De manière similaire, l’examen d'une seconde duplication (en haut dans la Figure 45) est

présenté dans la Figure 52. Dans ce cas, les profils d'expression des paralogues sont fortement

corrélés pendant le développement, alors qu'ils le sont beaucoup moins en réponse aux stress

abiotiques. Pour exemple, la valeur de corrélation minimale en réponse aux stress abiotiques

est de 0,08 entre les gènes TraesCS2B01G118500 et TraesCS2A01G101100.

4. Diversité allélique au sein de la famille TaNAC

4.1. Selon les données de la puce BW_420K

La localisation sur la pseudomolécule des 420 000 marqueurs identifiés avec la puce BW_420K

est connue. Par ce biais, seuls les marqueurs contenus dans la séquence génomique des 488

TaNAC et des 1500 pb en amont et en aval de chaque gène ont été conservés. Ceci a permis de

mettre en évidence 494 marqueurs de polymorphisme, répartis sur 158 gènes TaNAC soit

32,4% des membres de cette famille. Ce polymorphisme est présent dans la séquence

génomique et/ou dans les 1500 pb de part et d’autre de cette séquence. Entre 1 et 14 marqueurs

ont été identifiés par gène pour ces 158 séquences (Tableau 13).

4.2. Selon les données de la base de données Whealbi

Cette analyse a révélé 1358 marqueurs polymorphes répartis sur 174 séquences TaNAC (soit

35,7% des membres de la famille), qui contiennent entre 1 et 79 marqueurs par gène (Tableau

14). Seule la moitié des gènes existants a été capturée pour la recherche de polymorphisme. Par

conséquent, les gènes qui ne présentent pas de variabilité lors de cette analyse peuvent être

monomorphes pour les lignées étudiées, ou simplement non-capturés.

Tableau 13 : Nombre de SNP identifiés, à partir des données de la puce BW_420K, dans les

exons et les introns de la séquence génomique des 478 TaNAC, et dans les 1500 pb en amont

(5’ UTR) et en aval (3’ UTR). Tous les gènes n’ont pas montré de polymorphisme, la dernière

ligne du tableau recense donc les gènes concernés parmi les 488 gènes testés.

BW_420K 5’UTR Exon Intron 3’UTR TOTAL

NombredeSNP 99(20%) 108(22%) 130(26%) 157(32%) 494

Nombremin - maxdeSNPpargène 1à5 1à6 1à6 1à5 1 à 14

NombredegènesTaNACconcernés 57 53 66 91 158

Tableau 14 : Nombre de SNP identifiés, à partir des données de Whealbi, dans les exons et

les introns de la séquence génomique des 478 TaNAC, et dans les 1500 pb en amont (5’ UTR)

et en aval (3’ UTR).. Tous les gènes n’ont pas montré de polymorphisme, la dernière ligne du

tableau recense donc les gènes concernés parmi les 488 gènes testés. Une séquence présente

64 SNP dans sa séquence intronique, ce qui est un nombre particulièrement élevé sachant que

la seconde n’en possède que 25.

Whealbi 5’UTR Exon Intron 3’UTR TOTAL

NombredeSNP 305(23%) 380(28%) 332(24%) 341(25%) 1358

Nombremin - maxdeSNPpargène 1à32 1à29 1à64 1à26 1 à 79

NombredegènesTaNACconcernés 65 98 80 81 174

Tableau 15 : Nombre de SNP identifiés, à partir des données de BW_420K et Whealbi, sans

doublon, dans les exons et les introns de la séquence génomique des 478 TaNAC, et dans les

1500 pb en amont (5’ UTR) et en aval (3’ UTR). La longueur concernée correspond au cumul

des longueurs d’UTR, d’exon ou d’intron de tous les gènes (par exemple, pour les 5’UTR,

comme 1500 pb sont prises en compte pour chacun des 478 gènes, la longueur concernée =

1500 pb * 478 gènes = 717 000 pb au total). La dernière ligne du tableau recense le nombre

de gènes ayant montré du polymorphisme parmi les 488 gènes testés.

BW_420K + Whealbi sans doublon 5’UTR Exon Intron 3’UTR TOTAL

NombredeSNP 382(22%) 461(27%) 422(24%) 460(27%) 1725

Longueurconcernée(pb) 717000 528864 428103 717000 2390967

Nombremin - maxdeSNPpargène 1à32 1à30 1à64 1à26 1 à 79

88

Les gènes TraesCS5D01G360700 et TraesCS5D01G360800 ne sont séparés que de 2449 pb, le

SNP identifié dans les 1500 pb respectivement en position 3’ et 5’ de chacun de ces 2 gènes est

donc le même, à la base 440369017 de la pseudomolécule. Les 2 identifications de ce SNP

unique ont été conservées pour l’analyse d’association car il n’est pas possible de déterminer

dans quelle mesure il participe à la régulation de l’expression de l’un ou l’autre des 2 gènes.

4.3. Compilation des données de variabilité obtenues avec BW_420K et avec Whealbi.

Certains marqueurs sont présents dans les 2 bases de données, additionner les résultats obtenus

pour BW_420K et Whealbi mènerait donc à une surestimation du polymorphisme au sein de

cette famille. Pour éviter ce problème, une compilation sans doublon des marqueurs identifiés

a été réalisée, ce qui a permis d’analyser la variabilité « totale » identifiée pour cette famille

(Tableau 15). Nous pouvons constater que BW_420K a fourni un nombre plus restreint de SNP

que Whealbi, ce qui était attendu compte tenu des différentes technologies utilisées.

La distribution des SNP entre les exons, les introns, les 5’ et 3’ UTRs, est relativement constante

et équitable : environ 25% des SNP sont identifiés dans chacune des régions génomiques

susnommées. Cependant, leur longueur n’est pas équivalente. Le Tableau 16 présente le

nombre de SNP identifiés par 1000 pb de chacune des 4 régions étudiées. Nous pouvons

constater que les introns concentrent le maximum de variabilité avec 0,99 SNP / 1000 pb, tandis

que les UTRs ne présentent que 0,53 à 0,64 SNP / 1000 pb. Lorsque cette valeur est calculée

pour chacun des 478 gènes ancrés sur un chromosome, le gène TraesCS7D01G543400 présente

la plus forte variabilité dans les exons, avec 24,4 SNP / 1000 pb codantes.

5. Association polymorphisme x phénotypes

5.1. SNP et composition protéique du grain

L’association des SNP identifiés précédemment avec les données de phénotypage de la Core

Collection Agronomique cultivée en 3 environnements différents (Annexe V et Tableau 17) a

été jugée significative lorsque le score était ≥ 3. Plusieurs marqueurs polymorphes génotypés

avec la puce BW_420K, dont 10 marqueurs provenant d’OTV et notés en Présence/Absence,

montrent une association significative avec des caractères de composition protéique. Six