• Aucun résultat trouvé

C. Caractéristiques géniques, biochimiques et structurales des PADs

1. Les gènes PADI codant les PADs

Chez l’homme, on trouve 5 isotypes de PADs : les PADs 1, 2, 3, 4 et 6. Pour l’anecdote, la PAD4 a d’abord été désignée PAD5. En effet, lorsque cette PAD a été identifiée chez l’Homme, une Pad4 avait déjà été caractérisée chez le rat. La nouvelle PAD humaine présentant une spécificité de substrats différente de Pad4, il a été pensé à l’époque qu’elle n’était pas l’orthologue de Pad4 de rat mais correspondait à un autre isotype, alors appelé PAD5. Suite aux analyses de séquence du génome, il s’est finalement avéré que la Pad4 de rat et la PAD5 humaine étaient orthologues, la PAD5 a donc été renommée PAD4. Une dernière PAD a ensuite été identifiée chez l’homme et elle a alors été nommée PAD6 pour que cela ne porte pas à confusion.

Les 5 isotypes de PADs sont codés par 5 gènes dénommés PADI. Ces gènes sont localisés au sein d’un même locus situé sur le chromosome 1 en position p35-36 et s’étendent sur 355 kb (Figure 42 ; Chavanas et al., 2004). Les 5 gènes PADI possèdent une longueur variable mais sont tous composés de 16 exons. Les séquences codantes des gènes PADI sont conservées puisque les protéines correspondantes présentent entre 59 à 71% d’homologie entre elles, la PAD6 étant l’isotype le moins conservé (Chavanas et al., 2006 ; Tableau 4 ; voir annexe 2). Un alignement multiple des séquences peptidiques des 5 PADs humaines a en outre mis en évidence la présence de multiples insertions dans la séquence de la PAD6, faisant de celle-ci le plus grand des isotypes (Méchin et al., 2007).

Chez la souris et le rat, 5 gènes Padi sont aussi retrouvés, regroupés sur des régions d’environ 240 kb respectivement en position 4E1 et 5q36 (Vossenaar et al., 2003). Les protéines Pads de souris présentent une forte homologie entre elles et avec leurs orthologues humains, de 82 à 96% d’homologies, montrant une grande conservation de ces gènes entre les deux espèces (Foulquier, 2007 ; Tableau 4). Les données génomiques disponibles ont permis de démontrer l’existence de ces 5 gènes Padi chez tous les mammifères alors qu’on en retrouve 3 chez les oiseaux (Gallus gallus) et seulement 1 chez les amphibiens (Xenopus laevis) et les poissons (Danio rerio, Takifugu rubripes et

Tetraodon nigroviridis). La construction d’un arbre phylogénétique, basé sur la comparaison des

séquences des gènes PADI entre ces différentes espèces, a révélé que le gène PADI2 est le premier à avoir divergé d’un ancêtre commun et a probablement conservé sa fonction biologique ancestrale. Lors de l’évolution des espèces, les autres gènes PADI auraient acquis des spécificités d’expression tissulaire ainsi que de nouvelles fonctions biologiques (Balandraud et al., 2005, Chavanas et al., 2004).

Figure 42 : Organisation génomique du locus PADI chez l’Homme (1p35-36). La taille des gènes (en-dessous)

et des régions intergéniques (au-dessus) est indiquée en kb. Les flèches ouvertes représentent la direction de transcription de chaque gène. D’après (Chavanas et al., 2004 ; Méchin et al., 2007).

Tableau 4 : Pourcentage d’homologie entre les séquences protéiques des paralogues humains des PADs et des orthologues humains et de souris

(%) Paralogues humains Orthologues

de souris (Pads)

PAD1 PAD2 PAD3 PAD4 PAD6

PAD1 100 65 68 71 59 85

PAD2 100 67 65 59 96

PAD3 100 68 60 93

PAD4 100 61 85

PAD6 100 82

D’après (Méchin et al., 2007 ; Foulquier, 2007).

2. Structure des PADs

La structure cristallographique de la PAD4 humaine puis plus récemment celles des PADs 2 et 1 ont été résolues par analyses de diffraction aux rayons X (Arita et al., 2004 ; Slade et al., 2015 ; Saijo

et al., 2016). Ces données cristallographiques ont permis de mettre en évidence le repliement des PADs en deux domaines : un domaine amino-terminal composé de deux sous-domaines « immunoglobulin-like » et un domaine carboxy-terminal comprenant le site actif. Le domaine

carboxy-terminal, qui est la partie la plus conservée entre les différents isotypes, est composé de 5 modules ββαβ et les premiers feuillets β de chaque module forment un sillon qui renferme le site catalytique (Figure 43A).

L’analyse de la structure cristallographique du complexe PAD4 - BAA ( ou N-α-benzoyl-L-arginine amide ; un substrat synthétique des PADs) a permis de mettre en évidence l’implication d’au moins neufs acides aminés de la PAD4 dans la formation du site actif et l’interaction avec le substrat (Arita

et al., 2004 ; Figure 43E). En particulier, les quatre résidus Cys-645, His-471, Asp-350 et Asp-473 de la PAD4 sont essentiels à l’activité catalytique puisque la substitution de l’un ou l’autre de ces acides aminés par une alanine (D350A, H471A, D473A et C645A) engendre une perte d’activité de l’enzyme

(Arita et al., 2004 ; Knuckley et al., 2007). Alors que les résidus Cys-645 et His-471 sont directement impliqués dans le mécanisme catalytique, les résidus Asp-350 et Asp-473 interagissent avec les atomes d’azote de la chaîne latérale de l’arginine cible via des liaisons hydrogènes, permettant de maintenir le substrat dans la poche du site actif (voir paragraphe IV.3.a). Les autres acides aminés, également impliqués dans l’interaction avec le substrat, sont les résidus Trp-347 et Val-469, qui interagissent avec la portion aliphatique de la chaîne latérale de l’arginine via des liaisons hydrophobes, et les résidus Arg-372, Arg-374 et Arg-639 qui interagissent avec les atomes d’oxygène et d’azote des liaisons peptidiques du substrat via des liaisons hydrogènes (l’une d’entre elles étant médiée par une molécule d’eau ; Figure 43E). Selon un alignement multiple des séquences primaires des 5 PADs humaines, la plupart de ces acides aminés sont conservés entre les différents isotypes, en particulier les quatre acides aminés essentiels à l’activité catalytique (Tableau 5). A l’inverse, il est intéressant de noter que les résidus Arg-374 et Arg-639 de la PAD4 sont peu conservés, ce qui pourrait en partie expliquer la différence de spécificité de substrat entre les isotypes de PADs (voir paragraphe IV.3.b).

Tableau 5 : Alignement de 9 acides aminés impliqués dans le site catalytique de la PAD4 avec les autres séquences paralogues

PAD1 Trp-349 Asp-352 Arg-374 Arg-376 Val-470 His-472 Asp-474 Leu-639 Cys-645

PAD2 Trp-348 Asp-351 Arg-373 Gly-375 Val-469 His-471 Asp-473 Phe-641 Cys-647

PAD3 Trp-347 Asp-350 Arg-372 Gly-374 Val-468 His-470 Asp-472 Leu-640 Cys646

PAD4 Trp-347 Asp-350 Arg-372 Arg-374 Val-469 His-471 Asp-473 Arg-639 Cys-645

PAD6 Trp-356 Asp-359 Gln-371 Ala-373 Thr-478 His-480 Asp-482 Glu-670 Ala-676*

Sur la base d’un alignement multiple réalisé avec le logiciel Multalin (http://multalin.toulouse.inra.fr/multalin) et les séquences de référence (numéros d’accession suivants : NP_037490.2, NP_031391.2, NP_057317.2, NP_036519.2, AAR38850.1 pour les PAD1, 2, 3, 4 et 6 respectivement (voir annexe 2)), sont indiqués en rouge les quatre acides aminés essentiels à l’activité catalytique, en bleu les autres acides aminés importants pour la fixation du substrat par la PAD4 (en gras). *Dans la séquence de la PAD6, deux cystéines encadrent le résidu Ala-676 (Cys675 et Cys677). D’après (Arita et al., 2004 ; Méchin et al., 2007 ; Slade et al., 2015 ; Saijo et al., 2016).

Les PADs, qui sont calcium-dépendantes, présentent des sites de fixation au calcium. La PAD4 possède 5 sites de liaison : Ca1 à Ca5. Ca1 et Ca2 sont présents dans la région carboxy-terminale, à proximité du site actif, alors que Ca3, 4 et 5 sont localisés dans une même région du domaine amino- terminal, à distance du site actif. Alors que la PAD2 présente un site de fixation du calcium supplémentaire (Ca6), situé dans le domaine amino-terminal, la PAD1 ne présente que 4 sites fixant le calcium (le site Ca5 décrit pour la PAD4 n’étant pas retrouvé pour cet isotype). La fixation des ions calcium au niveau de ces sites induit un changement de conformation important des PADs. La poche comprenant le site actif se resserre, ce qui est important pour la sélectivité des substrats. Un réagencement des acides aminés du site actif a lieu, nécessaire à l’activation enzymatique (Figures 43D et 49 ; Liu et al., 2013).

Au sein des cristaux, la PAD4 et la PAD2 forment des homodimères qui s’associent de manière antiparallèle : le domaine amino-terminal d’une molécule interagit avec le domaine carboxy-terminal de la seconde (Figure 43B). Cette dimérisation semble jouer un rôle important dans la régulation de l’activité enzymatique de ces PADs. En effet, des formes mutées de PAD4 incapables de s’associer en dimère présentent une activité enzymatique réduite en comparaison à la forme sauvage (Liu et al., 2011). Cependant, à l’heure actuelle, on ne sait pas sous quelle(s) forme(s) existe(nt) ces deux isotypes in vivo. Le cristal de la PAD1, quant à lui, ne présente pas cette organisation dimérique. Une analyse de diffusion des rayons X aux petits angles montre de plus que la PAD1 existe sous forme monomérique en solution (Saijo et al., 2016). Même si la PAD1 présente une structure dans l’ensemble très proche de celles des PADs 4 et 2, son extrémité amino-terminale, moins repliée et précédée d’une boucle plus allongée que les autres isotypes, pourrait prévenir la formation de dimère (Figure 43C). De plus, l’arginine en position 8, décrite comme jouant un rôle clé dans la stabilité du dimère de PAD4, n’est pas conservée dans la séquence de la PAD1 (le résidu 8 est une glutamine), ce qui suggère encore que la PAD1 n’existe que sous forme monomérique (Liu et al., 2011). Bien que la structure cristallographique de la PAD3 n’ait pas été résolue, plusieurs données laissent penser que cet isotype existe sous forme dimérique. En effet, les principaux résidus impliqués dans la formation et la stabilité du dimère de PAD4 sont conservés ou substitués par des acides aminés homologues dans la séquence de la PAD3 (par exemple : en position 435, la tyrosine est remplacée par une leucine, ces deux résidus étant hydrophobes ; Liu et al., 2011). En outre, une analyse de diffusion des rayons X aux petits angles de la PAD3 en solution révèle aussi une association en dimère de cet isotype (Saijo et al., 2016).

Enfin, la PAD4 est le seul isotype à présenter un signal de nucléarisation, dont la fonctionnalité a été démontrée dans des cellules HL-60 en culture (Nakashima et al., 2002).

Figure 43 : Structures cristallographiques des PADs. (A) Structure cristallographique de la PAD2 sur laquelle sont positionnés les 6 sites de liaisons du calcium (Ca1-6). Comme toutes les PADs, la PAD2 est constituée d’un domaine carboxy-terminal et d’un domaine amino-terminal composé de deux sous-domaines « immunoglobin-like » (IgG1 et IgG2). D’après (Slade et al., 2015). (B) Homodimère formé par l’association tête-bêche de deux PAD2. D’après (Slade et al., 2015). (C) Superposition de la structure cristallographique des PADs 1, 2 et 4. Ces trois PADs présentent une structure très semblable. Cependant, la PAD1 présente une extrémité amino-terminale plus détendue, qui est précédée par une boucle plus allongée par rapport aux deux autres isotypes (structures indiquées par les flèches). D’après (Saijo et al., 2016). (D) Conformation de la PAD4 en absence de calcium, en présence de calcium, et en présence de calcium et d’un substrat synthétique, le N- α-benzoyl-L-arginine amide (BAA). La fixation du calcium engendre un changement important de la conformation de la PAD avec en particulier la formation de l’étroit sillon refermant le site actif. D’après (Arita

et al., 2004). (E) Focus sur les acides aminés de la PAD4 impliqués dans la liaison au substrat de la structure cristallographique du complexe PAD4 inactivée (A645) – BAA. D’après (Arita et al., 2006).