• Aucun résultat trouvé

4.1. Les protéines à domaine LIM chez les animaux

Les protéines à domaine LIM eucaryotes jouent un rôle important dans les processus biologiques fondamentaux tels que l’organisation du cytosquelette, la transcription, la détermination des lignées cellulaires, le développement des organes et la régulation de fonctions pathologiques comme l’oncogenèse (Bach, 2000). Le nom du domaine LIM dérive

des initiales des trois premiers facteurs de transcription découverts : LIN-11 de

Caenorabibditis elegans (Freyd et al., 1990), ISL-1 du rat (Karlsson et al., 1990) et MEC-3

de C. elegans (Way & Chalfie, 1988). Ces trois protéines contiennent en plus de leurs deux domaines LIM riches en cystéines, un homéodomaine supplémentaire permettant la fixation à l’ADN. Depuis, une grande variété de protéines contenant un ou plusieurs domaines LIM a été décrite chez les eucaryotes. Toutes les données bibliographiques montrent que les protéines LIM forment une famille complexe et présentent une grande variété de fonctions essentielles dans divers processus biologiques. Les protéines LIM sont connues pour être nucléaires, cytoplasmiques ou faisant la navette entre ces deux compartiments cellulaires. De plus, les protéines à domaine LIM sont capables d’interagir avec elles même, d’autres protéines à domaine LIM ou des protéines non apparentées. Ainsi, le domaine LIM est un module d’interaction protéine/protéine et facilite l’assemblage de complexes multiprotéiques dans la cellule.

4.1.1. Séquence et structure des domaines LIM

Chaque domaine LIM individuel comprend approximativement 55 acides aminés avec huit résidus très conservés, surtout des cystéines et histidines, ayant des positions bien précises. La séquence consensus classique du domaine LIM a été définie comme telle [C-X2 -C-X16-23-H-X2-C]-X2-[C-X2-C-X16-21-C-X2-3-C(D,H)] (où X représente n’importe quel acide aminé) (Schmeichel & Beckerle, 1994). Toutefois, des variations dans cette séquence consensus ont été constatées avec l’analyse de l’ensemble des protéines LIM humaines et d’autres espèces (Fig. 26). Le nombre et l’espacement conservés des huit résidus cystéines et histidines définissent des motifs de liaison aux métaux au sein de ces domaines LIM, et il a

été montré que ce domaine lie préférentiellement le zinc par rapport au fer (Michelsen et al., 1993). Le domaine LIM coordonne donc deux atomes de zinc ce qui définit la topologie de deux motifs à doigt de zinc répétés en tandem. Deux résidus conservés séparent les deux doigts de zinc, et l’espacement entre ces doigts de zinc semble être essentiel à leurs fonctions (Michelsen et al., 1994 ; Schmeichel & Beckerle, 1997). De plus, il y a plusieurs résidus aliphatiques ou volumineux modérément conservés qui sont situés à des positions bien définies (Fig. 26). Le reste de la séquence du domaine LIM est très variable et confère aux protéines LIM leurs spécificités fonctionnelles. Les acides aminés conservés facilitent la formation d’une structure cœur et les acides aminés variables permettent une fixation de haute affinité avec de nombreuses protéines partenaires ayant des structures et des fonctions diverses.

Figure 26. Séquence consensus et topologie du domaine LIM (Kadrmas et Beckerle, 2004)

A. Espacement et identité des huit résidus liant le zinc, basé sur l’analyse de 135 séquences LIM humaines. Les acides aminés rarement observés (inférieur à 10 % des cas) ne sont pas indiqués en gras. X représente n’importe quel acide aminé.

B. Topologie de la structure du domaine LIM et de la coordination au zinc. Les ronds violets indiquent les résidus se liant au zinc. Les résidus aliphatiques ou volumineux semi conservés sont représentés par des ronds verts, et les résidus non conservés avec un espacement invariant sont figurés par des ronds magentas. Les lignes hachurées et les ronds jaunes indiquent le nombre variable de résidus (X) au sein des boucles des doigts de zinc.

La détermination par spectroscopie RMN de la structure tridimensionnelle du domaine LIM C-terminal de la protéine « Cystein Rich Protein 1 » (CRP1) montre que les deux modules contenant un atome de zinc (CCHC et CCCC) comprennent deux feuillets β antiparallèles arrangés de manière orthogonale, et le deuxième module (CCCC) se termine par

A

une hélice α (Fig. 27) (Perez-Alvarado et al., 1994). Les deux doigt de zinc constituant le domaine LIM représentent des entités structurelles séparées qui sont tenues ensembles dans une configuration particulière par un réseau d’interactions hydrophobes. La coordination conservée tétraédrique du zinc établit la structure secondaire et le repliement tertiaire du domaine LIM et au niveau des boucles, plusieurs résidus hydrophobes importants aident à l’emballage des deux doigts de zinc. Des études RMN sur d’autres protéines LIM telles que les protéines LMO ont montré la conservation du repliement des domaines LIM (Kadrmas & Beckerle, 2004). Le repliement tertiaire des domaines LIM dans le contexte des protéines CRP1 et CRP2 entières est identique à la structure des domaines LIM isolés. Dans ces protéines, il n’y a pas de préférence dans l’organisation spatiale des deux domaines LIM supportant la notion que les deux domaines LIM sont des structures et des modules fonctionnels indépendants et que ces protéines servent d’adaptateurs pour la formation de complexes macromoléculaires.

4.1.2. Les domaines LIM sont des modules d’interaction protéine/protéine et peuvent fixer l’ADN

Les études structurales par RMN montrent que le deuxième module à doigt de zinc du domaine LIM est structurellement similaire au domaine à doigt de zinc de type GATA (Perez-Alvarado et al., 1994), capable de se lier à l’ADN. Bien que ce deuxième doigt de zinc adopte

Figure 27. Structure des domaines LIM individuels de la protéine CRP2 (Weiskirchen et Günther, 2003).

Représentation schématique des structure RMN des domaines LIM1 (A) et LIM2 (B) de la protéine CRP2 de caille incluant les atomes des chaînes latérales des résidus cystéines et histidines coordinant le zinc. Dans ce modèle, les feuillets β sont indiqués en jaune/orange, les hélices α sont de couleur magenta et les atomes de zinc sont représentés par des sphères rouges.

un repliement théoriquement compatible avec une fixation aux acides nucléiques, le domaine LIM est plutôt impliqué dans des interactions protéine/protéine spécifiques et participerait à la formation de complexes multiprotéiques (Schmeichel & Beckerle, 1994 ; Dawid et al., 1998). Jusqu’à présent, chez les animaux, il n’y a pas d’évidences convaincantes montrant une interaction directe entre les domaines LIM et l’ADN in vivo. Ceci est d’autant plus intrigant que beaucoup de protéines à domaine LIM participent au contrôle transcriptionnel dans le noyau. Toutefois, la protéine Hic5 de la famille des paxillines est la seule protéine à domaine LIM de vertébrés connue pour être capable de se lier à l’ADN in vitro (Nishiya et al., 1998). La protéine Hic5 se fixe à l’ADN par l’intermédiaire de ces quatre domaines LIM en C-terminal de la protéine et chacun des domaines LIM contribue à la fixation à l’ADN de manière distincte. De plus, chez les plantes il a été montré que les protéines SF3 (HaPLIM1) et NtLIM1 peuvent se fixer à l’ADN (Baltz et al., 1996 ; Kawaoka et al., 2000). Chez les animaux, les domaines LIM sont plus connus comme participant à des interactions protéine/protéine, mais une séquence consensus ou un élément structurel capable de se fixer aux domaines LIM est encore à déterminer (Kadrmas & Beckerle, 2004). Le domaine LIM semble fournir un cadre structurel stable sur lequel plusieurs sortes de spécificités de liaison peuvent être superposées. Un petit motif peptidique linéaire présentant une haute affinité pour les domaines LIM est actuellement peu probable, et les spécificités de liaison seraient plutôt dispersées au sein des protéines interagissant avec les domaines LIM. Dans beaucoup de cas, le domaine LIM seul est suffisant pour la fixation spécifique d’une protéine partenaire, mais il a été montré que les séquences adjacentes au domaine LIM peuvent intervenir dans la liaison (Arber & Caroni, 1996). De plus, un domaine LIM peut fixer simultanément plusieurs protéines, et des domaines LIM en tandem peuvent aussi fixer un partenaire unique (Schmeichel & Beckerle, 1998 ; Kadrmas & Beckerle, 2004).

4.1.3. Les protéines contenant des domaines LIM chez les eucaryotes

Les protéines à domaines LIM sont rencontrées dans une grande variété d’organismes eucaryotes, et tous les génomes séquencés d’eucaryotes codent pour des protéines contenant des domaines LIM. Par contre, aucune protéine à domaine LIM n’a été identifiée chez les procaryotes. Chez l’homme, il existerait au moins 58 gènes codant pour des protéines contenant au moins un domaine LIM (Kadrmas & Beckerle, 2004). Les protéines LIM humaines contiennent un à cinq domaines LIM conservés. Avec 135 domaines LIM

répertoriés chez l’homme, l’abondance de ce domaine dans les protéines est similaire à celui d’autres domaines d’interaction protéine/protéine comme les domaines « Src homology-2 ou

3 » (SH2 et SH3). Les invertébrés comme la drosophile (Drosophila melanogaster) ou C. elegans possèdent à peu près les mêmes familles de protéines LIM que les vertébrés, mais le

nombre de protéines LIM au sein de chaque famille est plus réduit. Les génomes de levures et de champignons codent pour un petit nombre de protéines à domaine(s) LIM. Par exemple, la levure ne contient que trois protéines à domaine LIM.

Les protéines à domaine LIM humaines qui ont été caractérisées au niveau moléculaire, et les différentes familles correspondantes sont récapitulées dans la figure 28. Les protéines LIM peuvent être composées exclusivement de domaines LIM, ou bien les domaines LIM positionnés en N-terminal ou C-terminal des protéines peuvent être associés à un autre domaine comme des homéodomaines, des domaines se liant au cytosquelette, des domaines catalytiques ou d’autres domaines d’interaction protéine/protéine tels que les domaines SH3, PDZ ou le motif LD (Fig. 28). Basé sur la structure et l’organisation des domaines LIM, la localisation subcellulaire et la fonction des protéines LIM, les familles de protéines LIM ont été classées en quatre groupes majeurs qui se recoupent entre eux (Bach, 2000 ; Kadrmas & Beckerle, 2004) : Ce sont les groupes « Nuclear only », « LIM only », « LIM actin associated » et « LIM catalytic ». Les similarités de séquences en acides aminés entre les domaines LIM définissant ces quatre catégories sont illustrées sur la figure 28 par des ovales de différentes couleurs. Les différents membres de chaque famille de protéines LIM portent souvent le même arrangement de domaines LIM, indiquant probablement une expansion de ces familles à partir d’une protéine ancestrale commune. Les domaines LIM1 (en rouge) ou LIM2 (en violet) des protéines nucléaires LHX et LMO ont une forte similarité de séquence entre eux et se distinguent globalement des autres domaines LIM appartenant aux protéines cytoplasmiques (Kadrmas & Beckerle, 2004). Au sein de chaque famille de protéines CRP et FHL, les multiples domaines LIM sont fortement apparentés entre eux, suggérant qu’ils sont apparus après un événement récent de duplication d’un domaine LIM ancestral (Fig. 28). Enfin, pour chacune des familles de protéines zyxine, paxilline, enigma, ALP et EPLIN, les domaines LIM composant la protéine sont en général divergents entre eux et ont ainsi pu être assemblés suite à la fusion de domaines LIM structurellement différents.

Ainsi, les génomes des animaux contiennent un grand nombre de gènes codant pour des protéines contenant un nombre variable de domaine LIM, associé ou non avec d’autres domaines. Il existe donc pour les protéines LIM animales une grande plasticité structurelle et en conséquence une importante diversité fonctionnelle. Pour plus d’informations concernant

les fonctions des protéines appartenant à ces familles LIM, je vous invite à la lecture des revues bibliographiques suivantes (Bach, 2000 ; Kadrmas & Beckerle, 2004). A l’inverse, les génomes de plantes semblent coder pour un nombre limité de protéines à domaine LIM, et celles découvertes jusqu’à présent sont toutes apparentées à la famille de protéines riches en cystéine (CRP) animale (Eliasson et al., 2000). Par ailleurs, les fonctions des protéines zyxine et Hic5 seront d’abord décrites ci-dessous car elles interagissent avec les protéines CRP.

Figure 28. Représentation schématique de la structure protéique des différentes familles de protéines à domaines LIM les mieux caractérisées chez l’Homme (Kadrmas et Beckerle, 2004)

Le nombre de gènes connus dans chaque famille est indiqué entre parenthèses. Les boîtes de différentes couleurs représentent les différentes catégories de protéines LIM communément définies. Les domaines LIM sont figurés par des ovales de différentes couleurs et ont été groupés en fonction de leurs similarités de séquence en acides aminés. Les autres domaines hétérologues comme les motifs LD, les domaines de liaison à l’actine, monooxygénase, SH3, et homeodomaine sont marqués par des rectangles bruns. Les rectangles hachurés indiquent les domaines dont les limites sont mal définies. Les lignes hachurées montrent que l’échelle n’est pas respectée.

ABLIM : actin-binding LIM protein ; ALP : α-actinin-associated LIM protein ; CH : calponin homology ; CRP : Cysteine-rich protein ; EPLIN : epithelial protein lost in neoplasm ; FHL : Four-and-a-half LIM ; GLY : glycine-rich region (GRR) ; LASP : LIM and SH3 protein ; LD : motif LD ayant la séquence consensus [LDXLLXXL] ; LHX : LIM-homeodomain protein ; LMK : LIM kinase ; LMO : LIM only ; MICAL : Molecule interacting with CASL protein-1 ; PDZ : postsynaptic density-95 (PSD95), Disc large, zona occludens-1 (ZO-1) ; PET : prickle espinas and testin ; PINCH Particularly interesting new cysteine and histidine-rich protein ; SH3, Src homology-3 ; VHP : villin head piece.

4.1.4. Les protéines zyxine et Hic5 sont associées aux adhésions focales et fibres de stress d’actine

Beaucoup de résultats montrent l’interaction de protéines à domaine LIM (dont CRP1 et CRP2) avec les fibres de stress d’actine intervenant dans la contraction des cellules animales. Ces fibres particulières sont des câbles de filaments d’actine contractiles et sont formées dans la cellule après attachements des filaments d’actine sur des complexes de protéines situés au niveau des adhésions focales. Les adhésions focales sont les sites où les cellules adhèrent à la matrice extracellulaire par l’intermédiaire des intégrines. Elles ont un rôle structurel de liaison entre la matrice extracellulaire et le cytoplasme, mais aussi dans la transduction du signal et dans la diffusion et la migration cellulaire. Ces complexes de protéines situés au niveau des adhésions focales comprennent entre autre les intégrines, le complexe Arp2/3, la zyxine, l’α-actinine, Hic5 et les CRPs. La formation des fibres de stress d’actine et des plaques d’adhésion est induite par la contraction/tension des cellules.

La zyxine est une protéine contenant trois domaines LIM en C-terminal, une région N-terminale riche en proline et un signal nucléaire d’exportation (Sadler et al., 1992 ; Wang & Gilmore, 2003). C’est une protéine ayant de multiples partenaires dans la cellule dont des protéines interagissant avec le cytosquelette ou la membrane plasmique, des molécules signal et des facteurs de transcription. Notamment, la zyxine interagit par ses domaines LIM avec les protéines CRP (Sadler et al., 1992) et avec l’α-actinine par sa région riche en proline (Reinhard et al., 1999). La zyxine présente une double localisation nucléaire et cytoplasmique. La phase nucléaire de la zyxine est transitoire et dans le cytoplasme elle est située le long des fibres de stress d’actine et au niveau des adhésions focales (Nix & Beckerle, 1997). De façon intéressante, la zyxine est capable de se diriger vers le noyau dans les cellules musculaires lisses vasculaires stimulées mécaniquement (Cattaruzza et al., 2004). De plus, dans un contexte cellulaire différent, la zyxine est aussi capable sous l’influence d’un stress mécanique d’étirement cyclique des cellules, de se mobiliser des adhésions focales vers les fibres de stress d’actine qui s’épaississent (Yoshigi et al., 2005). La zyxine est donc une protéine faisant la navette entre les adhésions focales, les fibres de stress d’actine et le noyau.

La protéine Hic5 appartient à la famille des paxillines. La paxilline et Hic5 sont des protéines localisées au niveau des adhésions focales, et interagissent avec de nombreux partenaires protéiques par l’intermédiaire des quatre domaines LIM en C-terminal, et des motifs LD en N-terminal (Kadrmas & Beckerle, 2004). Contrairement à la paxilline ayant une expression ubiquitaire, la protéine Hic5 est exprimée seulement dans les cellules musculaires

lisses de souris (Kim-Kaneyama et al., 2005). De façon intéressante, les domaines LIM2 et LIM3 en C-terminal sont responsables de la localisation de la protéine Hic5 sur les adhésions focales en condition normale (non étirée) et le long des fibres de stress d’actine quand un étirement mécanique est appliqué aux cellules. De plus Hic5 est capable d’interagir avec la protéine CRP2 par ses domaines LIM en C-terminal. Enfin, la protéine Hic5 a un effet suppressif sur la capacité contractile des cellules entourées d’un gel de collagène tridimensionnel, et cet effet est aboli quand les domaines LIM2 et LIM3 sont mutés. Ces résultats suggèrent qu’en réponse à un étirement mécanique cyclique, la protéine Hic5 est relocalisée vers les fibres de stress d’actine et régule négativement la force contractile des cellules (Kim-Kaneyama et al., 2005). Il apparaît ainsi que le complexe Hic5/CRP2/zyxine pourrait réguler l’organisation du cytosquelette d’actine lors de stress mécanique.

4.2. La famille de protéines riches en cystéines (CRP) chez les eucaryotes

4.2.1. Structure des protéines CRP

Au sein de la famille des protéines riches en cystéines (CRP), il existe quatre membres chez l’homme et les animaux : CRP1, CRP2, CRP3/MLP pour « muscle LIM protein » et TLP pour « thymus LIM protein ». Les trois protéines CRP présentent une forte identité de séquence (supérieure à 65 %) et sont composées uniquement de deux domaines LIM séparés par un long espaceur de 56 à 59 acides aminés (Fig. 29A) (Weiskirchen & Günther, 2003). La protéine TLP est plus divergente avec en moyenne 30 % d’identité en acides aminés avec les protéines CRP (Kirchner et al., 2001). Contrairement, aux autres protéines possédant de multiples domaines LIM séparés entre eux par 8 à 10 acides aminé, la région flexible liant les deux domaines LIM des protéines CRP est nettement plus longue d’environ 50 acides aminés, et caractérise cette famille de protéine. La taille de ces protéines (environ 200 acides aminés), ainsi que la taille des domaines LIM et l’espacement entre chaque domaine LIM sont très conservés. Les domaines LIM des protéines CRP mesurent de 52 à 53 acides aminés et présentent la séquence consensus suivante [C-X2-C-X17-H-X2-C]-X2-[C-X2-C-X17-C-X2-3-C] (Fig. 29B). Nous pouvons noter que la protéine TLP diffère dans la composition de ces deux domaines LIM par l’addition d’un résidu histidine supplémentaire suivant la troisième cystéine du second doigt de zinc (Fig. 29C). Chaque domaine LIM est suivi d’une région riche en glycine (GRR) marquant la distinction entre les protéines CRP et les autres protéines

LIM-only. De plus, les protéines CRP1 à 3 possèdent une séquence putative d’adressage nucléaire [K/R-K/R-Y-G-P-K] au niveau des acides aminé 64 à 69 et qui chevauche partiellement la région GRR suivant le premier domaine LIM. Par ailleurs, chez la drosophile (Drosophila melanogaster) deux protéines CRP atypiques Mlp60A et Mlp84B pour « Muscle

lim proteins » ont été découvertes (Stronach et al., 1996). Mlp60A ne possède qu’un domaine

LIM alors que Mlp84B en contient cinq (Fig. 29A). Ces domaines LIM très similaires à ceux des protéines CRP, sont également suivis de régions GRR et ces deux protéines possèdent le signal putatif d’adressage nucléaire. Enfin, la protéine DdLIM, renommée plus tard DdLIME, est la première protéine à domaine LIM isolée chez l’amibe Dictyostelium discoideum (Prassler et al., 1998). Elle comporte un seul domaine LIM suivi d’une région riche en glycines typique du groupe de protéines CRP, mais plus étendue. Plus récemment, les gènes

DdLIMC et D ont été caractérisés et codent aussi pour des protéines homologues aux

protéines CRP animales, sauf que ces protéines ne possèdent pas de région GRR et DdLIMD ne contient qu’un seul domaine LIM en N-terminal (Khurana et al., 2002).

Figure 29. Structure des protéines « Cystein Rich Protein » (CRP) animales et de leurs deux domaines LIM (Weiskirchen & Günther, 2003).

A. Représentation schématique de la topologie des protéines CRP de l’Homme (hCRP1, hCRP2, hCRP3/MLP), et CRP-like de la souris (mTLP-A, mTLP-B) et de la drosophile (dMlp84B, dMlp60A). Le nom des protéines et le nombre total d’acides aminés sont donnés à gauche de chaque protéine. Les domaines LIM sont indiqués par des boites bleues et les positions des régions riches en glycines (GRR) sont représentées par des boites de couleur magenta. B. Topologie des deux structures en doigts de zinc (CCHC et CCCC), et séquence consensus des deux domaines LIM des protéines CRP1, CRP2, CRP3/MLP et TLP. C. Alignement multiple de séquences (ClustalW) des domaines LIM1 et LIM2 issus des protéines CRP1 à 3 et TLP de souris. Les résidus cystéines et histidines conservés coordonnant les atomes de zinc des deux domaines LIM sont indiqués par un arrière fond noir. Les résidus identiques, similaires ou présentant une faible similarité biochimique sont respectivement indiqués par un astérisque, un double point et un simple point.

A B

4.2.2. Les gènes CRP sont préférentiellement exprimés dans les cellules musculaires Bien que les protéines CRP soient structurellement très similaires, les gènes codant les protéines CRP présentent des profils d’expression différents (Tableau 6), suggérant que les