• Aucun résultat trouvé

Caractéristiques de la séquence protéique LsCP1 de cystéine protéase de Lathyrus

Chapitre V : Projet d’article n°4 : Caractérisation d’un ADNc complet de cystéine protéase isolé de

4. Caractéristiques de la séquence protéique LsCP1 de cystéine protéase de Lathyrus

Lathyrus sativus

4.1.Structure générale de la LsCP1

L’analyse de la protéine déduite de LsCP1 (http://bioinfo.hku.hk/services/analyseq/cgi- bin/mwcalc_in.pl) indique un point isoélectrique de 6.59 et une masse moléculaire de 38 700 Da.

L’étude de l’usage des codons dans la séquence codante de LsCP1 (http://mobyle.pasteur.fr/cgi-bin/MobylePortal/portal.py?form=cusp) a permis de montrer que certains codons ne sont jamais utilisés dans la séquence de cystéine protéase du Lathyrus sativus comme GTA (V), ACG (T) et CGC (R).

L’analyse par « Prosite » (http://www.expasy.ch/tools/scanprosite/) a permis de localiser deux sites actifs de cystéine protéase. Le premier est un site actif « cystéine » (référence Uniprot PS00139) et est situé entre les acides aminés 151 et 162 : QGHCGSCWTFST (Fig. 21), correspondant au motif : Q-{V}-x-{DE}-[GE]-{F}-C-[YW]-{DN}-x-[STAGC]-[STAGCV]. Le deuxième est un site actif « histidine » eucaryotique (référence Uniprot PS00639) localisé entre les acides aminés 295 et 305 : VNHAVLAVGYG (Fig. 21), correspondant au motif : [LIVMGSTAN]-{IEVK}-H-[GSACE]-[LIVM]-{GPSI}-[LIVMAT](2)-G-{SLAG}-

[GSADNH].

Un troisième site actif non localisé par le logiciel est cependant présent sur la séquence LsCP1, il s’agit d’un site actif « asparagine » correspondant au motif : [FYCH]-[WI]-[LIVT]- x-[KRQAG]-N-[ST]-W-x(3)-[FYW]-G-x(2)-G-[LFYW]-[LIVMFYG]-x-[LIVMF]

(Nieuwenhuizen et al., 2007) situé entre les acides aminés 312 et 331 : YWHIKNSWGGDWGDHGYFKM (Fig. 21).

L’analyse par « InterProScan Sequence Search » (http://www.ebi.ac.uk/Tools/InterProScan/) a permis de confirmer la position des deux premiers sites actifs et l’appartenance de LsCP1 à la famille des peptidases C1A. Deux domaines caractéristiques de ces protéases sont également présents : un domaine protéase C1A en C-terminal (référence Uniprot PF00112) et un domaine inhibiteur de la protéase (I29).

154 La comparaison de la séquence protéique LsCP1 avec la base de donnée MEROPS permet de confirmer l’appartenance de cette protéine à la famille des protéases C1A de type papaïne et de la classer parmi les aleuraïnes (identifiant MEROPS : C01.041). Cette analyse nous donne aussi l’emplacement des résidus catalytiques, Gln, Cys, His et Asn respectivement en position 151, 157, 296 et 316 (Fig. 21). Ces résultats sont en accord avec l’analyse « Prosite » précédente.

4.2.Recherche d’un peptide signal

Un peptide signal est constitué de trois zones distinctes : une région N-terminal (‘n-region’) qui contient souvent des acides aminés chargés positivement, une région hydrophobe (‘h- region’) composé d’au moins six acides aminés et une région C-terminale (‘c-region’) de résidus non chargés contenant en position -3 et -1 le site de clivage.

La méthode NNs (neural networks) a été utilisée par le logiciel « SignalP 3.0 » (http://www.cbs.dtu.dk/services/SignalP/) (Emanuelsson et al., 2007) et les résultats indiquent la présence d’un peptide signal à +47, avec un site de clivage entre les acides aminés 18 et 19 (Fig. 21). La ‘n-region’ se situerait entre les acides aminés 1 et 5, la ‘h-region’ entre les 6 et 14 et la ‘c-region’ entre 15 et 18.

La présence de la séquence N-P-I-R au 26ème acide aminé dans le propeptide N-terminal indique que la protéine LsCP1 sera dirigée après bourgeonnement de l’appareil de Golgi vers les vacuoles lytiques (Matsuoka et Nakamura, 1991; Holwerda et al., 1992; Nakamura et Matsuoka, 1993; Paris et al., 1996; Vitale et Raikhel, 1999)

4.3.Recherche des sites de glycosylation et de phosphorylation

La glycosylation des protéines se fait au niveau du réticulum endoplasmique puis de l’appareil de golgi, après l’élimination du peptide signal.

La recherche des sites de glycosylation et donc des asparagines prédites pour être N- glycosylées (http://www.cbs.dtu.dk/services/NetNGlyc/): Asn-X(sauf Pro)-Ser/Thr, a mis en évidence trois sites de glycosylation au niveau des Asn 117, 177 et 246 sur LsCP1 (Fig. 21).

La phosphorylation des protéines enzymatiques est le plus souvent nécessaire à leur activation et participe à la régulation de leur activité.

155 (http://www.cbs.dtu.dk/services/NetPhos/) a donné de nombreux sites au niveau de huit serines, trois thréonines et cinq tyrosines (Fig. 21).

4.4.Recherche d’un peptide de transit chloroplastique

Un grand nombre de protéines des chloroplastes sont des protéines codées par le génome nucléaire et synthétisées dans le cytoplasme avant d’être importées dans le chloroplaste grâce à un peptide de transit chloroplastique (Weil, 1998). La recherche de ce type de signal (http://www.cbs.dtu.dk/services/ChloroP/) s’est révélée négative pour LsCP1.

5.

Discussion

Un nouvel ADNc complet de cystéine protéase a été isolé à partir de feuilles de Lathyrus sativus. La séquence d’ADNc LsCP1 est composée de 1285 pb et après traduction donne une protéine de 351acides aminés. La comparaison de cette séquence protéique avec les bases de données protéiques et l’étude de sa structure permettent de l’identifier comme étant une cystéine protéase de la famille des C1A de type papaine. Cette séquence est composée dans la région N-terminale d’un peptide signal et d’un domaine inhibiteur de la protéase (I29). La région C-terminale contient un domaine caractéristique des protéases C1A, portant les trois sites actifs nécessaires à l’activité catalytique (Fig. 23). De plus cette séquence protéique présente des sites de glycosylation et de phosphorylation nécessaires à la maturation et à l’activation de la protéine. La présence du peptide signal permet de prédire la localisation de la protéine LsCP1 dans la ‘voix sécrétoire’, ce qui correspondrait à une localisation lysosomale.

Les cystéines protéases étant essentielles dans la régulation de l’accumulation des protéines non fonctionnelles, et suivant le modèle établi au laboratoire dans la voie lysosomale responsable de l’autolyse cellulaire adaptative (ACA), l’expression du gène codant cette nouvelle cystéine protéase LsCP1 pourrait être étudiée en réponse à diverses contraintes ou stimuli tels que la sécheresse, la salinité excessive ou les phytohormones (ABA ou acide jasmonique). Les variations de l’accumulation des transcrits en réponse au Pb ont été étudiées et sont décrites chapitres III et IV. La production de la protéine LsCP1 dans un système hétérologue eucaryotique (baculovirus/cellules d’insectes) pourrait permettre l’étude de ses caractéristiques biochimiques et fonctionnelles in vitro. Si la production de la protéine est

156 suffisante, l’obtention d’anticorps polyclonaux permettrait d’étudier par hybridation Western, les modalités de la traduction en réponse à divers contraintes abiotiques.

peptide signal

domaine inhibiteur

de la protéase domaine protéase C1A

site actif « cystéine » site actif « histidine» pro peptide site actif « asparagine»

Gln Cys His Asn

351 aa

Figure 23 : Schéma de la cystéine protéase LsCP1 isolée chez Lathyrus sativus (351 acides aminés). Dans le peptide signal : ‘n-region’ : , ‘h-region’ : ; ‘c-region’ : . Le site de clivage est signalé par une flèche. Gln, Cys, His et Asn représentent les acides aminés catalytiques.

157

Chapitre VI :