• Aucun résultat trouvé

1. Introduction

1.5. Les protéines PPR

1.5.3. Organisation des motifs : les PPR classiques vs les PPR-PLS

Les protéines PPR comportent en moyenne 12 motifs, mais cela peut varier de 2 à 30 en fonction des protéines (Small & Peeters, 2000; Lurin et al., 2004; Lightowlers & Chrzanowska-Lightowlers, 2013). Les répétitions PPR se présentent généralement sous la forme d’un continuum ininterrompu qui s’étale sur au moins sur les deux tiers de la protéine. Chez Arabidopsis, les motifs PPR sont adjacents les uns aux autres sans trous entre les motifs pour environ la moitié des protéines. Pour l’autre moitié, on observe des trous réguliers de 65 à 70 acides aminés (Lurin et al., 2004)

Les gènes codant les protéines PPR contiennent rarement des introns. Plus de 80 % des PPR ne contiennent qu’un exon, et seulement 7 % contiennent plus d’un intron (Figure 17). Ceci explique pourquoi les gènes PPR sont relativement courts (2 kb en moyenne entre l’ATG et le stop) en dépit du fait que les protéines PPR soient plutôt de grande taille (642 acides aminés en moyenne) (Lurin et al., 2004).

Figure 17 - Représentation graphique de la proportion de gènes PPR présentant des introns (Lurin et al., 2004).

1.5.3.1.Les PPR-P vs les PPR-PLS

Il existe plusieurs types de protéines PPR, les PPR « classiques » correspondant à celles présentées ci-avant, et les PPR-PLS, qui seront présentées ensuite. Comme mentionné ci-avant, les PPR classiques (dites PPR-P pour Pures) ont été décrites comme des protéines présentant des répétitions en tandem de 35 aminés. Or, il a été défini en 2004 de nouveaux

Genes sans intron!

Genes avec un intron!

64

motifs de 31 et 36 acides aminés. La comparaison de séquences a montré qu’il s’agit bien de motifs PPR, comme décrit dans Small & Peeters, 2000. Ces motifs ont été appelés PPR-like S (pour short) et PPR-like L (pour long). Les protéines PPR comportant les trois types de motifs P, L et S sont été appelées protéines PPR-PLS, et ne sont rencontrées que chez les plantes (Lurin et al., 2004). Il est fort probable que la sous-famille PPR-P soit apparue suite à l’expansion des PPR communes aux eucaryotes, tandis que les répétitions de la sous-famille PPR-PLS sont probablement apparues suite à des mutations des répétitions PPR classiques (Lurin et al., 2004).

Récemment, de nouvelles études bio-informatiques ont été menées et une nouvelle classification des protéines PPR a vue le jour. Dorénavant, les protéines PPR sont considérées comme Pures si elles comprennent une majorité de motifs P, et les protéines PPR-PLS sont caractérisées par le fait qu’elles comprennent soit des domaines C-terminaux additionnels (cf. ci-après) soit une majorité de motifs L et S. Ces dernières peuvent commencer indifféremment par un motif de type P, L ou S. Il semblerait que les protéines PPR-PLS aient une conformation similaire aux PPR-P, chaque motif P, L et S formant une paire d’hélices α antiparallèles (Cheng et al., 2016).

1.5.3.2.Les séquences N et C-terminales des protéines PPR

1.5.3.2.1. Les séquences N-terminales des protéines PPR

Les séquences N-terminales des protéines PPR sont pour la plupart liées à l’adressage aux organites et montrent une faible conservation entre les protéines (Cheng et al., 2016).

1.5.3.2.2. Les séquences C-terminales des protéines PPR

A l’inverse des séquences présentent en N-terminal, les extensions C-terminales des protéines PPR présentent un niveau de conservation considérable dans la plupart des cas (Lurin et al., 2004; Cheng et al., 2016). L’alignement des séquences C-terminales des protéines PPR-PLS a permis de définir trois motifs : E, E+ et DYW (DYW étant le tripeptide terminal), qui ne sont retrouvés que dans la sous-famille PPR-PLS (Lurin et al., 2004). De plus, la structure répétée des protéines PPR s’étend au delà des motifs P, L et S dans la mesure où la partie N-terminale du domaine E semble contenir deux motifs PPR-like, appelés E1 et E2 (Cheng et al., 2016).

65

L’organisation relative des trois motifs C-terminaux suit quelques règles quasi-absolues (Lurin et al., 2004) :

- Les motifs ne sont jamais présents en copies multiples dans une même protéine - Ils sont en général colinéaires et toujours dans le même ordre : E1 – E2 – DYW

- Les protéines portant le motif DYW portent pratiquement toujours les domaines E1 et E2

L’identification de ces motifs C-terminaux a permis de définir plusieurs sous-classes de protéines PPR-PLS (Figure 19) (Lurin et al., 2004; Cheng et al., 2016) :

- Les protéines qui n’ont aucun domaine C-terminal (sous-classe PLS) - Les protéines ayant un motif E1 seul (sous-classe E1)

- Les protéines ayant les motifs E1 et E2 (sous-classe E2) - Les protéines ayant les motifs E1, E2 et E+ (sous-classe E+) - Les protéines ayant les motifs E1, E2 et DYW (sous-classe DYW)

1.5.3.3.Les variants du motif PPR canonique

Au total, 10 variants du motif PPR ont été décrits et se présentent selon un schéma caractéristique. Le motif P présente les variants P1 et P2 (uniquement présents chez les PPR-PLS), le motif L devient L1 ou L2 et le motif S devient S1, S2 ou SS, ce dernier étant systématiquement juxtaposé à un autre motif S. Enfin, les motifs E1 et E2 dorénavant considérés comme des variants du motif PPR à part entière (Cheng et al., 2016). L’alignement des séquences consensus de ces différents variants en comparaison au motif P est représenté en Figure 18 et l’architecture des protéines PPR en incluant cette nouvelle nomenclature est représentée en Figure 19.

66

Figure 18 – Alignement des séquences consensus des différents types de motifs PPR (Cheng et al., 2016)

Alignement des différents variants des motifs PPR et PPR-like. Des séquences de consensus, dérivées de EMBOSS, ont été obtenues en utilisant des séquences de motifs PPR à partir de 41 génomes représentatifs. Les résidus en majuscule sont fortement conservés dans chaque motif. Les résidus en gras correspondent à ceux du motif P. Les résidus soulignés indiquent les différences entre P2 et P1,

L2 et L1, S2 et S1, SS et P1 et SS et S1. Les deux hélices α de chacun des motifs sont surlignées en

67

Figure 19 – Architecture des protéines PPR chez les plantes (Cheng et al., 2016)

(a) Structures schématiques des protéines PPR des différentes sous-familles. Le nombre de motifs dans chaque protéine peut varier de 2 à 30, et le premier motif peut être indifféremment P, P1, L1, S1 ou SS. Le sous-groupe E + se compose de protéines avec un domaine DYW dégénéré ou tronqué.

(b) Comparaison de l’organisation des domaines C-terminaux E et DYW proposés par (Lurin et al.,

2004) (en haut), et ceux proposés par (Cheng et al., 2016) (en bas). « PG » indique la « boîte PG »

conservée (Hayes et al., 2013) tandis que HSE et CxDC indiquent la séquence signature de la désaminase liant le zinc (Salone et al., 2007; Hayes et al., 2013, 2015; Boussardon et al., 2014; Wagoner et al., 2015).

68