Partie A - Introduction
Partie A - Introduction
Amines et apparentés
acétylcholine, adrénaline, dopamine, histamine, mélatonine, noradrénaline, sérotonine, tyramine
Peptides et protéines
anaphylatoxines C3a et C5a du complément, angiotensine, bradykinine, calcitonin gene related peptide, calcitonine, CD55 – decay accelerating factor (DAF), chimiokines (MIP-1α, -1β, 2, 3α, 3β; éotaxine;
IP-10; RANTES; MCP-1, -2, -3, -4, -5; GRO-α, -β, -γ; interleukine 8; TARC; HCC-1; MDC; MIG; I-TAC;
I-309; TECK; SDF-1; fractaline; GCP-2; PARC; DC-CK-1; lymphotactine; ENA-78; NAP-2; LIX; ELC EBI1; LARC; SLC), cholécystokinine, conopressine, corticotropin-releasing factor, encéphalines, endorphines, endothéline, fMLP et autres peptides formylés, galanine, gastric inhibitory peptide (GIP), gastrine, ghrelin, glucagon, glucagon-like peptide, gonadolibérine (GnRH), gonadotropin releasing hormone (GRH), growth hormone secretagogue (GHS), hormone diurétique, hormones glycoprotéiques (LH, hCG, FSH, TSH), latrotoxine, mélanocortine, neuromedine, neuropeptide Y, neurotensine, opioïdes, oxytocine, peptide inhibiteur gastrique, peptides d'amphibiens (ranatensine, bombésine), phéromones fongiques, PTH/PTHrP, sécrétine, somatolibérine (GHRH), somatostatine, tachykinine, thrombin and protease-activated pituitary adenylyl cyclase-activating peptide (PACAP), thrombine, thyréolibérine (TRH), vasoactive intestinal peptide (VIP), vasopressine, vasotocine
Acides aminés
glutamate, acide γ -aminobutyrique (GABA)
Ions Ca
2+Lipides anandamide, cannabinoïdes (delta-9-tétrahydrocannabinol), leucotriènes, acide lysophosphatidique, platelet activating factor (PAF)
Icosanoïdes prostacyclines, prostaglandines, thromboxanes
Stimuli extérieurs
photons (indirectement par le rétinal), molécules olfactives et du goût
Nucléosides / nucléotides
adénosine, ADP, ATP, UTP
Tableau A-1 : Les différentes familles de ligands activant des récepteurs couplés aux protéines G.
Pour chaque famille, une série d'exemples (adapté de Flower, 1999).
1 Les récepteurs couplés aux protéines G
La transmission d'informations via les récepteurs couplés aux protéines G (GPCR : G-protein- coupled receptors ou encore RCPG) forme sans doute le mode de communication intercellulaire le plus répandu chez les eucaryotes. Les RCPG partagent cette tâche avec au moins deux autres classes de récepteurs membranaires : les récepteurs à activité tyrosine-kinase ainsi que les canaux ioniques activés par des ligands (Hubbard et Till, 2000). Pour une revue exhaustive des RCPG, voir Biochimica et Biophysica Acta Biomembrane (2007) 1768 (4) : 747 – 1018.
On dénombre aujourd'hui plusieurs milliers de RCPG (16 764 entrées dans la banque de données GPCRDB en 2006, voir http://ww.gpcr.org/7tm). Chez l'homme, environ 800 gènes de RCPG potentiels sont répertoriés dont environ 400 encodant des récepteurs sensoriels (olfactifs ou du goût).
Ceci représente plus d'un pourcent du génome humain (Takeda et al. , 2002 ; Vassilatis et al. , 2003).
Pour un quart seulement des RCPG, le ligand a été identifié (Fang et al. , 2003), les autres récepteurs étant qualifiés d' ‘orphelins’ . Dans d'autres espèces comme le nématode Caenorhabditis elegans , les gènes de RCPG (y compris putatifs) peuvent occuper jusqu'à 5 % du génome.
L'existence des RCPG et leur fonctionnement ont été mis en évidence depuis la fin des années 1960, notamment par les travaux des équipes d'Alfred G. Gilman et Martin Rodbell (Prix Nobel conjoint de Physiologie/Médecine en 1994), voir Casey et Gilman (1988) ainsi que le texte de leurs conférences Nobel : Gilman (1995) et Rodbell (1995).
1.1 Fonction(s)
Dans la chaîne de transmission de l'information, le rôle d'un RCPG consiste à établir un lien fonctionnel et unidirectionnel entre l'extérieur et l'intérieur de la cellule. Recevoir un signal (chimique ou physique) présent à l'extérieur de la cellule et le transmettre sous une autre forme, à l'intérieur, où des molécules associées (les protéines G) vont à leur tour induire une série de réactions permettant d'amplifier le signal.
Au cours de l'évolution, les RCPG se sont adaptés à une très grande variété de stimuli
chimiques : acides aminés, lipides, peptides, (glyco-)protéines, nucléotides, nucléosides, ions,
molécules odorantes (voir tableau A-1) ainsi qu'à la stimulation physique par des photons, dans le cas
de la rhodopsine (Flower, 1999). Ils peuvent intervenir dans la réception de messagers de la
Partie A - Introduction
Figure A-1 : Structure d'un récepteur couplé aux protéines G et action d'un agoniste sur ce récepteur.
TM1-7 : domaines transmembranaires ; IL1- 3 : boucles intracellulaires ; OL1- 3 : boucles extracellulaires
NH
2HOOC
agoniste
β α
γ
GDP GTP
β γ α GTP
+
extérieur de la cellule
intérieur de la cellule
T M 1 T M 2 T M 3 T M 4 T M 5 T M 6 T M 7
IL1 IL2 IL3
OL1 OL2 OL3
Sous
unité Famille Sous-types Effecteurs Messagers secondaires
α α
sGα
s, Gα
olfAdénylate cyclase ↗
Canaux Ca
2+Canaux K
+AMPc ↗
Influx de Ca
2+Efflux de K
+α
i/oGα
i-1, Gα
i-2, Gα
i-3Adénylate cyclase ↘
Phospholipase A
2Canaux K
+AMPc ↘
Efflux d'arachidonate ↘
Efflux de K
+Gα
oA, Gα
oB, Canaux Ca
2+Canaux K
+↘ Influx Ca
2+Efflux K
+Gα
t1, Gα
t2GMPc phosphodiestérase
Phospholipase A
2Canaux Ca
2+↘
GMPc ↘
Efflux d'arachidonate ↘
Ca
2+↘
Gα
zGMPc phosphodiestérase ↗
Phospholipase C Canaux K
+GMPc ↗
IP3, diacylglycérol, Ca
2+Efflux K
+↘
α
q/11Gα
q, Gα
11, Gα
14, Gα
15, Gα
16Phospholipase C-β IP3, diacylglycérol, Ca
2+α
12Gα
12, Gα
13Échangeur-1 Na
+/H
+Échange Na
+/H
+β β
1–5Différents
assemblages de sous-unités β et γ
Adénylate cyclase ↗ / ↘
Phospholipase C (β
1, β
2, β
3) ↗
Phosphatidylinositol 3-kinase γ ↗
γ γ
1–11Protéine kinase C ↗
Protéine kinase D ↗
GPCR kinases ↗
Canaux Ca
2+, K
+et Na
+Tableau A-2 : Principaux types de sous-unités des protéines G, effecteurs primaires et messagers
secondaires, d'après Morris et Malbon (1999) et Hermans (2003).
Partie A - Introduction
Figure A-2 : La rhodopsine bovine. Structure tridimensionnelle obtenue par diffraction des rayons-X.
La structure protéique est colorée en arc-en-ciel ( TM I : rouge/orange, TM II : orange/jaune, TM III : jaune/vert, TM IV : vert, TM V : vert-bleu, TM VI : bleu-indigo, TM VII : violet.
Le groupement prosthétique 11- cis -rétinal (en noir) se trouve au milieu des hélices. Image générée par Cn3D 4.1 au départ des données de 1F88.pdb (Palczewski et al. , 2000).
C-ter (côté cytoplasmique)
N-ter
(côté extracellulaire)
dans les perceptions sensorielles (odeurs, goûts, phéromones, lumière, …). Le stimulus peut être exogène (odeur, goût ou chimioattractant) ou endogène ; dans ce second cas, le stimulus peut faire partie d'un mécanisme endocrine aussi bien qu'exocrine ou paracrine. Ces RCPG stimulés par des substances endogènes sont parfois qualifiés d' endo GPCRs (Civelli, 2005). L'effet de l'activation d'un RCPG chez l'homme va de la contraction ou la relaxation musculaire et la dégradation du glycogène (récepteurs α
2- ou β-adrénergiques) à l'inhibition ou la stimulation de sécrétions exocrines (sécrétine) ou endocrines (somatostatine et thyréotropine [TSH]) (Alemany et al. , 2007).
La plupart des RCPG connus sont spécifiquement stimulés par la liaison d'une molécule activatrice (l'agoniste) ou sélectivement par un petit nombre d'espèces similaires. Il existe cependant quelques cas de RCPG activés par toute une série d'agonistes. Ainsi le récepteur GPRC6A humain est stimulé par les acides α-aminés L basiques ainsi que (plus faiblement) par la glycine, la L -alanine et la
L -sérine (Wellendorph et al. , 2005).
Dans tous les cas, l'agoniste induit un changement de la conformation tridimensionnelle du RCPG, lui permettant de se lier à une protéine G (c'est-à-dire liant la guanosine triphosphate : GTP) ancrée dans la membrane. Cette protéine G, constituée de trois sous-unités (G
α, G
βet G
γ), est associée à une molécule de guanosine diphosphate (GDP). L'association RCPG–protéine G induit l'échange du GDP par le GTP ainsi que la dissociation du trimère en G
α–GTP et G
βγ(voir figure A-1). Chacun de ces sous-ensembles va réguler positivement ou négativement une série d'effecteurs comme les phospholipases, l'adénylate cyclase ou des canaux ioniques (voir tableau A-2), modifiant la concentration intracellulaire en messagers secondaires. Finalement, le GTP est hydrolysé en GDP, libérant G
α–GDP de l'interaction avec son effecteur et permettant la réassociation avec G
βγqui se voit dès lors également libéré de son effecteur (Hermans, 2003).
Outre les protéines G trimériques, il existe également une série de petites protéines G monomériques (Bhattacharya et al. , 2004) transduisant les signaux des RCPG. Elles sont structurellement classées en 5 familles (Ras, Rho/Rac/cdc42, Rab, Sar1/Arf et Ran) et peuvent être activées soit directement par les RCPG soit au travers des protéines G trimériques.
1.2 Structure(s) des RCPG
Les RCPG sont également appelés communément récepteurs hepta-hélices ou récepteurs à 7 TM ,
ceci à cause de leur principale caractéristique structurelle commune : la présence d'un domaine
Partie A - Introduction
Figure A-3 : Modes d'interactions entre récepteurs couplés aux protéines G (RCPG) et leur agoniste.
D'après Flower (1999) et Kobilka (2007).
A. monoamines
extérieur
intérieur
E. acides aminés / ions
extérieur
intérieur
B. peptides / chimiokines
extérieur
intérieur
C. hormones glycoprotéiques
extérieur
intérieur
F. lumière (11-cis-rétinal) D. thrombine
extérieur
intérieur
extérieur
intérieur
T rans M embranaire ‘serpentin’ constitué de sept hélices α hydrophobes de 30~40 résidus, alternativement séparées par des boucles intra- ou extracellulaires (respectivement I nner- L oop IL et
O uter- L oop OL) de longueurs variables (Palczewski et al. , 2000). Du côté aminoterminal (N-ter) de ce domaine transmembranaire, se trouve la partie externe du récepteur tandis qu'à l'extrémité carboxyterminale (C-ter) se retrouve la partie interne exposée au cytoplasme (voir figure A-1). La partie extracellulaire peut être de longueurs très différentes en fonction du récepteur : de 10 à 50 acides aminés pour les récepteurs aux monoamines et aux peptides et jusqu'à plusieurs centaines d'acides aminés pour les récepteurs des hormones glycoprotéiques (RHG) et au glutamate (Kobilka, 2007).
La structure tertiaire généralement acceptée pour le domaine serpentin des RCPG est basée sur le modèle de Baldwin (1993) ainsi que sur la structure cristalline de la rhodopsine bovine obtenue par diffraction des rayons X (voir figure A-2 et Okada et al. , 2004). Dans ce modèle, les sept hélices transmembranaires (numérotées TM I à TM VII dans le sens N-ter → C-ter) sont plus ou moins perpendiculaires à la membrane et arrangées autour d'une poche centrale. Les TM I , II , III et V sont cependant plus inclinés par rapport à la membrane que les TM IV , VI et VII . Dans le cas de la rhodopsine, la stimulation lumineuse entraîne un mouvement relatif des TM III et VI menant à l'activation du récepteur (Gether et al. , 2002).
Le site de liaison de l'agoniste (ligand activateur) est assez variable en fonction des RCPG. Le ligand peut entrer directement entre les hélices transmembranaires (récepteur β2-adrénergique) – voire y être fixé en permanence comme le groupement prosthétique 11- cis -rétinal dans la rhodopsine –, interagir avec la surface extérieure du récepteur (pour les peptides et chimiokines) ou la surface du domaine extracellulaire (pour les hormones glycoprotéiques), soit encore cliver par son action protéolytique une partie de la chaîne aminoterminale du récepteur (pour la thrombine), voir figure A-3, Flower, 1999 et Kobilka, 2007.
Notons que, bien que la confusion soit commune dans la littérature, toutes les protéines à 7
domaines transmembranaires ne sont pas couplées aux protéines G. Ainsi la bactériorhodopsine de
Halobacterium halobium , premier modèle structurel de la famille 7 TM , est une pompe à proton.
Partie A - Introduction A.
Famille 1 – Type A – Classe I : rhodopsine, récepteurs adrénergiques Famille 2 – Type B – Classe II : récepteur à la calcitonine, sécrétine Famille 3 – Type C – Classe III : récepteurs métabotropiques Famille 4 : récepteurs VN
1(voméronasal), VN
4, VN
6Famille 5 : frizzled, smoothened et homologues
B.
Clan A : rhodopsin-like
Famille I : récepteurs olfactifs, à l'adénosine et à la mélanocortine Famille II: récepteurs aux amines
Famille III : opsines des vertébrés et récepteurs aux neuropeptides Famille IV : opsines des invertébrés
Famille V : récepteurs aux chimiokines, du chimiotactisme, à la somatostatine, aux opioïdes Famille VI : récepteurs à la mélatononine
Clan B : récepteurs à la calcitonine et apparentés
Famille I : récepteurs à la calcitonine, calcitonin-like et CRF Famille II : récepteurs PTH/PTHrP
Famille III : récepteurs au glucagon et à la sécrétine Famille IV : récepteur à la latrotoxine
Clan C : récepteurs métabotropique du glutamate et apparentés Famille I : récepteurs métabotropique au glutamate Famille II : récepteurs au calcium
Famille III : récepteurs GABA-B
Famille IV : récepteurs aux phéromones putatives
Clan D : récepteurs à la phéromone STE2 Clan E : récepteurs à la phéromone STE3 Clan F : récepteurs à l'AMPc
Tableau A-3 : Les différents classements des récepteurs couplés aux protéines G.
A. Classement en 5 familles (1, 2, 3, 4, 5) d'après Bockaert et Pin, 1998,
en 3 types (A, B, C) d'après Howard et al. , 2001 ou en 3 classes (I, II, III) d'après Foord, 2002.
B. Classement en 6 clans et 14 sous-familles, d'après Flower, 1999.
1.1 Dimérisation des RCPG
La plupart des RCPG forment au niveau membranaire des homo- ou hétérodimères capables de transmettre le signal de l'agoniste (Milligan, 2004 ; Terrillon et Bouvier, 2004 ; Prinster et al. , 2005).
Dans certains cas (le récepteur à l'acide γ-aminobutyrique B : GABA
B), il a été démontré que le dimère membranaire comporte une sous-unité capable de lier l'agoniste tandis que la seconde sous- unité permet l'exportation du dimère à la membrane ainsi que le couplage à la protéine G (Jones et al. , 1998 ; White et al. , 1998 ; Kaupmann et al. , 1998). Un autre cas rapporté dans la littérature récente est celui de gènes ayant une structure de RCPG orphelin qui forment des dimères avec d'autres RCPG et dont le seul rôle serait de moduler l'efficacité de ce RCPG, notamment en l'inhibant (Levoye et al. , 2006a et b).
1.3 Classification des RCPG
Tous les RCPG répertoriés forment donc une superfamille partageant des caractéristiques de structure secondaire communes au niveau de leur domaine serpentin . En revanche, il existe une très grande variabilité au niveau des deux extrémités, tant au point de vue de leurs séquences qu'à celui de leurs longueurs. De plus, la nature du ligand ainsi que le mode d'interaction avec celui-ci détermine plusieurs types de RCPG. Les RCPG ont donc été classifiés au fil du temps en plusieurs types, classes ou familles en fonction de leurs similarités de séquences (Huang et al. , 2004), voir tableau A-3. Le classement GRAFS (Fredriksson et al. , 2003 ; Schiöth et Fredriksson, 2005), basé sur l'analyse phylogénétique des homologies au niveau du domaine serpentin , répertorie les RCPG en 5 familles principales : lutamate, G R hodopsine, A dhésion, F rizzled/Taste2 et S écrétine dont la plus grande (celle de la rhodopsine) est encore subdivisée en 13 sous-groupes (voir figure A-4).
1.4 Pathologies associées aux RCPG et applications thérapeutiques
De par leur position centrale dans la chaîne de transduction de l'information, les RCPG sont à
l'origine de nombreuses pathologies héréditaires : une altération génétique peut causer la perte
d'activité d'un récepteur ou au contraire le gain d'une activité constitutive (Spiegel et al. , 1993 ;
Bockaert et Pin, 1998 ; Smits et al. , 2003). Le daltonisme est ainsi causé par une mutation des opsines
rouge et/ou verte (Nathans et al. , 1989), alors que des mutations dans les gènes des récepteurs à la
thyréotropine (TSH) ou à l'hormone lutéinisante (LH) peuvent causer respectivement un adénome
hyperfonctionnel thyroïdien (Parma et al. , 1993) ou une puberté précoce familiale (Shenker et al. ,
Partie A - Introduction
Figure A-4 : Arbre des relations phylogénétiques entre les différentes familles de récepteurs couplés
Glutamate
Sécrétine
Frizzled/Taste2
Adhésion
Rhodopsine
α
β γ
δ
récepteurs olfactifs
LGR8 LGR7
FSHr LH/CGr
LGR4 TSHr
LGR6
LGR5
du récepteur à la vasopressine V2 cause une résistance à l'action antidiurétique de cette hormone.
Dans certains cas, la déficience familiale aux glucocorticoïdes – causée par une résistance à l'hormone corticotrope (ACTH) – s'est révélée être due à des mutations ponctuelles perte de fonction du récepteur à l'ACTH (Spiegel et al. , 1993). Certains agents pathogènes sont également capables de modifier la cascade de transduction du signal de récepteurs couplés aux protéines G. Ainsi, le vibrion du choléra produit une exotoxine qui catalyse l'ADP-ribosylation d'un résidu arginine de la sous unité Gα
s, ce qui inhibe l'activité GTPase et cause une activation permanente de la protéine G
s. La toxine pertussique (produite par Bordetella pertussis , l'agent de la coqueluche) génère une modification équivalente, sur une cystéine des sous-unités Gα
iet Gα
o; il en résulte un découplage entre récepteur et protéine G, ce qui bloque la transduction du signal (Spiegel et al. , 1993).
D'autre part, l'étude des RCPG possède un intérêt particulier dans le domaine thérapeutique. On
estime à environ 50 % la proportion des médicaments actuels ayant pour cible un RCPG (Fang et al. ,
2003). Il s'agit généralement d'agonistes ou d'antagonistes synthétiques ou naturels. Ainsi, les
antimigraineux Imitrex
®( succinate de sumatriptan ) et Maxalt
®( benzoate de rizatriptan ) sont des
agonistes des récepteurs à la sérotonine 5-HT
1B/1D. De même, le bêtabloquant Inderal
®( hydrochlorure
de propanolol ) est un antagoniste des récepteurs β-adrénergiques ; Cozaar
®( losartan potassique )
utilisé contre l'hypertension est un antagoniste du récepteur AT
1à l'angiotensine II ; Claritine
®( loratadine ) utilisé contre le rhume des foins et Zantac
®( hydrochlorure de ranitidine ) utilisé dans le
traitement à court terme des ulcères duodénal et gastrique sont des antagonistes des récepteurs à
l'histamine (respectivement H
1et H
2) ; le broncho-dilatateur Singulair
®( montelukast sodique ) est un
antagoniste des récepteurs aux leucotriènes D4 et E4 (voir Howard et al. , 2001 ; Presland, 2004,
http://www.cbip.be, http://www.fda.gov et http://www.vidal.fr ). D'autres modes d'actions sont aussi
explorés comme dans le cas du Mimpara
®( cinacalcet ) utilisé pour le traitement de
l'hyperparathyroïdie secondaire chez les patients dialysés atteints d’insuffisance rénale chronique
terminale qui augmente la sensibilité du récepteur senseur de Ca
2+-extracellulaire agissant sur la
sécrétion d'hormone parathyroïdienne (Block et al. , 2004).
Partie A - Introduction
2 Un cas particulier : la rhodopsine
La rhodopsine, protéine photoréceptrice des cellules en bâtonnet, fut le premier récepteur couplé aux protéines G à être cloné (Nathans et Hogness, 1983). Elle est facilement disponible en grandes quantités à partir de rétine de bovins et, dès lors, sert toujours de modèle structurel de l'une des grandes familles de RCPG (Palczewski et al. , 2000).
La rhodopsine est constituée de l'opsine (une protéine transmembranaire de 40 kDa dont l'extrémité aminoterminale est extracellulaire et l'extrémité carboxyterminale se trouve dans le cytosol) ainsi que de son ligand chromophore, le 11- cis -rétinal (situé parallèlement à la membrane au sein d'une poche formée par les hélices de l'opsine, voir figure A-2). Le 11- cis -rétinal est lié par covalence à la lysine 296 de l'opsine par une base de Schiff. La stimulation par la lumière a pour effet d'isomériser le 11- cis -rétinal en tout- trans -rétinal ce qui provoque des réarrangements de la structure protéique. Finalement, il y a activation d'une cascade enzymatique menant à l'hydrolyse du GMP cyclique, ce qui a comme effet de fermer des canaux à cations (Stryer, 1997 ; Albert et Yeagle, 2002).
Du point de vue structurel, la majorité des récepteurs de la famille de la rhodopsine sont
caractérisés par la présence dans les 2 premières boucles extracellulaires d'un résidu cystéine impliqué
dans la stabilité de la protéine, ainsi que – au début de la deuxième boucle intracellulaire – d'un motif
D-R-Y (parfois E-R-W) impliqué dans l'interaction avec les protéines G. Ce motif D-R-Y est absent
des autres familles de RCPG. Plusieurs sites de N-glycosylation sont présents dans le domaine N-
terminal tandis que du côté C-terminal sont présents des sites de phosphorylation et/ou de
palmitoylation (Howard et al. , 2001).
Partie A - Introduction
Figure A-5 : Structure tridimensionnelle de domaines protéiques composés de motifs répétés riches en leucine (LRR).
a. Domaine fonctionnel de l’internaline (InlA) de Listeria monocytogenes . Les feuillets β de la face interne sont colorées en fuschia, les hélices α et les coudes sont colorés en jaune. Image générée par Cn3D 4.1 (NCBI) au départ des données de 1O6V.pdb (Schubert et al. , 2002).
b. Inhibiteur de ribonucléase porcine. Les feuillets β de la face interne sont colorés en ocre, les hélices α sont colorées en cyan et indiqués par un cylindre vert. Image générée par Cn3D 4.1 (NCBI) au départ des données de 2BNH.pdb (Kobe et Deisenhofer, 1996).
c. Domaine de liaison du récepteur humain à la FSH (résolution de 2,9 Å). Les feuillets β de la face c
a b
c
a b
3 La famille LGR
Les LGR (Leucine-rich G-protein-coupled Receptors) constituent une sous-famille de gènes de RCPG de la famille de la rhodopsine. Parmi ces LGR figurent les trois récepteurs aux hormones glycoprotéiques (TSHr, FSHr, et LH/CGr, respectivement récepteurs à la thyréotropine [TSH], à l'hormone folliculo-stimulante [FSH] et à l'hormone lutéinisante [LH] et la gonadotrophine chorionique [hCG]). Pour une série de LGR, cependant, le ligand, la fonction ainsi que le couplage intracellulaire sont encore inconnus.
Ces récepteurs sont structurellement caractérisés par la présence d'un très grand domaine aminoterminal extracellulaire (ou ecto domaine). Cet ectodomaine qui constitue quasiment la moitié de la séquence protéique des récepteurs comporte une répétition de 9 à 18 motifs riches en leucines (leucine-rich repeats ou LRR) justifiant leur appellation. Un LRR est une séquence de 20 à 29 acides aminés dont un segment conservé de 11 a.a. contient la séquence LxxLxx(N/C)xL (L pouvant être une leucine, valine, isoleucine ou phénylalanine) (Kristiansen, 2004). La structure tridimensionnelle d'un domaine LRR a été déterminée par diffraction des rayons X dans une série de protéines : inhibiteur de ribonucléase (Kobe et Deisenhofer, 1995), internaline (Schubert et al. , 2002) ou encore le récepteur à la TSH (Kajava et al. , 1995). Chaque motif répété riche en leucines se replie sous forme d'un court feuillet β suivi généralement d'une hélice α. Chaque LRR se positionne quasi parallèlement au précédent, les feuillets β formant la surface intérieure d'une structure en fer à cheval, tandis que les hélices α en forment l'extérieur (voir figure A-5 a et b). Le modèle du récepteur FSHr (Fan et Hendrickson, 2005) diffère légèrement de ceci car dans celui-ci les feuillets β formant la surface interne du site de liaison de l'hormone ne sont pas séparés par des hélices α (voir figure A5 c).
Les domaines LRR sont connus pour être impliquée dans des interactions protéines-protéines
(Kobe et Deisenhofer, 1994 et Kobe et Kajava, 2001) : par exemples, l'interaction entre le facteur de
von Willebrand et les LRR de la glycoprotéine Ibα, présente à la surface des plaquettes (Huizinga et
al. , 2002) ; ou encore l'interaction entre les LRR de l'internaline de Listeria monocytogenes (InlA) et le
domaine aminoterminal extracellulaire de la cadhérine-E humaine (hEC1) lors de l'adhésion et
l'invasion des cellules épithéliales de l'intestin par la bactérie (Schubert et al. , 2002). Pour les trois
LGR récepteurs aux hormones glycoprotéiques (RHG), la région extracellulaire forme le domaine de
liaison de l'agoniste, ce qui est aussi probablement le cas pour les autres LGR.
Partie A - Introduction
Nom du LGR Organisme N°accès GenBank Agoniste(s)
FSHR Homo sapiens AAB26480 FSH
LH/hCGR Homo sapiens AAB19917 LH / hCG
TSHR Homo sapiens CAA02195 TSH/thyrostimuline
DLGR1 Drosophila melanogaster NP_524393 GPA2+GPB5
Ghra Anthopleura elegantissima P35409 ?
nLGR Caenorhabditis elegans AAF82248 ?
DLGR2 Drosophila melanogaster NP_476702 bursicon
Cg-LGRB Crassostrea gigas CAD71143 ?
LGR4 Homo sapiens NP_060960 ?
LGR5 Homo sapiens NP_003658 ?
LGR6 Homo sapiens NP_001017403 ?
LGR7 Homo sapiens Q9HBX9 relaxine, relaxine 3
LGR8 Homo sapiens AAL69324 INSL3, relaxine
DLGR3 Drosophila melanogaster NP_733115 ?
DLGR4 Drosophila melanogaster ABI34171 ?
GRL101 Lymnaea stagnalis CAA80651 ?
Figure A-6 : La famille LGR.
a. Liens phylogénétiques entre les trois types de LGR (types A, B et C). Arbre phylogénétique réalisé avec ClustalW2 (Chenna et al. , 2003) sur base de l’alignement des séquences protéiques entières (voir le texte pour les références individuelles). Pour les LGR de vertébrés, seules les séquences
9
9
17 17 18
Peptide signal Cystine-rich Leucine-rich repeats 7TM C-term
a
b
T y p e A
T y p e B
T y p e C
9
FSHR H. sapiens
LH/hCGR H. sapiens
TSHR H. sapiens
DLGR1 D. melanogaster Ghra A. elegantissima
nLGR C. elegans
DLGR2 D. melanogaster Cg-LGRB C.gigas
LGR4 H.sapiens
LGR5 H.sapiens
LGR6 H.sapiens
LGR7 H.sapiens
LGR8 H.sapiens
DLGR3 D.melanogaster DLGR4 D.melanogaster GRL101 L.stagnalis T y
p e A
T y p e B
T y p e C
9 9
18
17
10 10
class A 10
10 class A
10 12 C-rich class A repeats
Gly-rich repeats 9
Nom du LGR Organisme N°accès GenBank Agoniste(s)
FSHR Homo sapiens AAB26480 FSH
LH/hCGR Homo sapiens AAB19917 LH / hCG
TSHR Homo sapiens CAA02195 TSH/thyrostimuline
DLGR1 Drosophila melanogaster NP_524393 GPA2+GPB5
Ghra Anthopleura elegantissima P35409 ?
nLGR Caenorhabditis elegans AAF82248 ?
DLGR2 Drosophila melanogaster NP_476702 bursicon
Cg-LGRB Crassostrea gigas CAD71143 ?
LGR4 Homo sapiens NP_060960 ?
LGR5 Homo sapiens NP_003658 ?
LGR6 Homo sapiens NP_001017403 ?
LGR7 Homo sapiens Q9HBX9 relaxine, relaxine 3
LGR8 Homo sapiens AAL69324 INSL3, relaxine
DLGR3 Drosophila melanogaster NP_733115 ?
DLGR4 Drosophila melanogaster ABI34171 ?
GRL101 Lymnaea stagnalis CAA80651 ?
Figure A-6 : La famille LGR.
a. Liens phylogénétiques entre les trois types de LGR (types A, B et C). Arbre phylogénétique réalisé avec ClustalW2 (Chenna et al. , 2003) sur base de l’alignement des séquences protéiques entières (voir le texte pour les références individuelles). Pour les LGR de vertébrés, seules les séquences
99
99
17 17 17 17 18 18
Peptide signal Cystine-rich Leucine-rich repeats 7TM C-term
a
b
T y p e A
T y p e B
T y p e C
99
FSHR H. sapiens
LH/hCGR H. sapiens
TSHR H. sapiens
DLGR1 D. melanogaster Ghra A. elegantissima
nLGR C. elegans
DLGR2 D. melanogaster Cg-LGRB C.gigas
LGR4 H.sapiens
LGR5 H.sapiens
LGR6 H.sapiens
LGR7 H.sapiens
LGR8 H.sapiens
DLGR3 D.melanogaster DLGR4 D.melanogaster GRL101 L.stagnalis T y
p e A
T y p e B
T y p e C
99 99
18 18
17 17
10 10 10 10
class A 101010 class A
10
class A 1010
class A
10
12 C-rich class A repeats 10
12 C-rich class A repeats
Gly-rich repeats
9 Gly-rich repeats
9
La famille LGR peut être divisée en trois sous-groupes (Hsu, 2003 et 2004 ; Herpin et al. , 2004) sur base de leurs homologies de séquences/structure (voir figures A6 a et b). Le type A inclut les récepteurs aux hormones glycoprotéiques et leurs homologues chez des invertébrés ; le type B correspond aux orphelins LGR4, LGR5 et LGR6 ainsi qu'au récepteur d'insecte au bursicon (DLGR2) ; et le type C comprend les récepteurs à la relaxine et l'INSL3 (insulin-like peptide 3) ainsi que leurs homologues chez les invertébrés.
Une hypothèse probable quant à l'évolution des LGR est qu'un gène unique a donné naissance très tôt dans l'évolution à trois gènes (A, B et C), qui selon les espèces auraient été conservés ou non et – éventuellement – dupliqués (Hsu, 2003). Ainsi, les vertébrés possèdent au total 8 gènes de LGR, numérotés LGR1 à LGR8 (3 de type A, 3 de type B et 2 de type C), tandis que la drosophile possède un LGR de chaque type et que d'autres invertébrés semblent n'avoir gardé qu'un seul LGR (de type A, B ou C), voir tableau A-4 et Van Loy et al. (2007b).
Une grande proportion de la littérature publiée à ce jour sur les LGR (orphelins) consiste en une
série d'articles uniques sur un gène LGR particulier décrivant son clonage, sa séquence, sa localisation
chromosomique et éventuellement quelques données d'expression obtenues par Northern blot. De
plus, plusieurs systèmes de dénomination et de classification ont été (et sont) utilisés pour les LGR
(voir tableau A-5). Dans la suite, la notation LGR
1–8sera systématiquement utilisée pour les récepteurs
orphelins tandis que les récepteurs aux hormones glycoprotéiques 'classiques' seront référencés par le
nom de leur ligand.
Partie A - Introduction
Vertébrés LGR1/
FSHr
LGR2/
LHCGr
LGR3/
TSHr LGR4 LGR5 LGR6 LGR7 LGR8
Homo sapiens 2492 3973 7253 55366 8549 59352 59350 122042
2p21-p16 2p21 14q31 11p14-p13 12q22-q23 1q32.1 4q32.1 13q13.1
Bos taurus 281172 281900 281553
11 11 10
Canis familiaris
481367
¤481365 403968 LOC476896 450220
10 10 8 21 25
Danio rerio 195820 402920 LOC558825
2 8 7
Felis catus 554348 493842
/ /
Gallus gallus 395962 395776 428900 LOC428605 427867 LOC428695
3 3 5 3 1 4
Macaca mulatta
716123 715999 574251 701736 718661 720813
13 13 7 14 11 11
Mus musculus
14309 16867 22095 107515 14160 329252 381489 140498
12 37.0 cM 17 46.5 cM 17 E5 2 E3 10 D2 1 E4 3 E3 5 84.0 cM
Ovis aries 443299 443428
/ /
Pan troglodytes
470371 453077 749403 743138
2A 14 11 12
Rattus norvegicus
25449 25477 25360 286994 299802 498233 295144 363866
6q12 6q12 6q31 3q33 7q22 13q13 2q32 12p12
Sus scrofa 397679 407247 397560
3q2.2-q2.3 3q22-q23 /
Xenopus laevis
378625 378624
/ /
¤
= similaire à un précurseur
Invertébrés DLGR1 DLGR2 DLGR3 DLGR4
Drosophila melanogaster
42133 34819 43098 32270
3R 90C2-90C2 2L 34E5-34E6 3R 96E8-96E9 X 11E1-11E1 Bombyx mori 692585
/
Apis mellifera Am47 LOC551621,
Am48 LG1 Caenorhabditis
elegans
179381*
V
* = homologue
Tableau A-4 : Les gènes de LGR. Nom LGR, GeneID (en gras) et localisation chromosomique, chez
les vertébrés et les invertébrés.
3.1 Les LGR de type A
3.1.1 Les récepteurs aux hormones glycoprotéiques (TSHr, LH/CGr et FSHr)
Les récepteurs aux hormones glycoprotéiques (RHG) sont les premiers membres de la famille LGR à avoir été clonés, avant l'apparition dans la littérature du terme LGR. Il s'agit des récepteurs aux LH/hCG (rat : McFarland et al. , 1989 ; porc : Loosfelt et al. , 1989 ; humain : Minegishi et al. , 1990), à la TSH (chien : Parmentier et al. , 1989 ; humain : Nagayama et al. , 1989 ; humain : Libert et al. , 1989 ; humain : Misrahi et al. , 1990) et à la FSH (humain : Minegishi et al. , 1991). Ils comportent tous les trois un domaine extracellulaire composé de 9 motifs répétés riches en leucines (LRR) qui forme le site de liaison de leur(s) agoniste(s). Ces agonistes sont des dimères glycoprotéiques composés d'une sous-unité α commune pour l'espèce et d'une sous-unité β spécifique au récepteur.
Le récepteur à la FSH (FSHr ou LGR1) est exprimé au niveau des gonades mâles et femelles.
Lorsque qu'il est activé par l'hormone folliculo-stimulante (FSH ou gonadostimuline A) produite par les gonadotropes de l'adénohypophyse, il stimule la gamétogenèse (croissance des follicules immatures ainsi que stimulation des cellules de la granulosa sécrétant l'œstradiol chez la femelle ou stimulation des cellules de Sertoli chez le mâle).
Le récepteur à la LH et l'hCG (LH/CGr ou LGR2) est exprimé au niveau des gonades mâles et femelles. Il est activé par l'hormone lutéinisante (LH ou gonadostimuline B) produite par les gonadotropes de l'adénohypophyse, ce qui déclenche chez la femme l'ovulation puis la sécrétion de progestérone et d'œstrogène. Lors de la grossesse, LH/CGr est également maintenu activé par la gonadotrophine chorionique (hCG) produite par l'embryon et le placenta, maintenant la production de progestérone. Chez l'homme, l'activation de LH/CGr par la LH induit la synthèse de testostérone par les cellules de Leydig.
Le récepteur à la TSH (TSHr ou LGR3) est exprimé majoritairement au niveau des cellules
principales de la thyroïde. Il est activé par la thyréotropine (TSH) produite par les thyréotropes de
l'adénohypophyse, ce qui induit l'augmentation du transport d'iode dans la thyroïde ainsi que la
production des hormones thyroïdiennes : triiodothyronine (T3) et thyroxine (T4). Ces deux hormones,
à leur tour, exercent un rétrocontrôle sur la production de TSH.
Partie A - Introduction
Espèce nom
LGR
Symbole (nom) officiel autres symboles / noms agoniste(s)
Homo sapiens
LGR1 FSHR (follicle stimulating hormone receptor)
FSHRO, MGC141667, MGC141668, ODG1, follitropin receptor, ovarian dysgenesis 1
FSH
LGR2 LHCGR (luteinizing
hormone/choriogonadotropin receptor)
LCGR, LHR, hLHR,
lutropin/choriogonadotropin receptor
LH, hCG
LGR3 TSHR (thyroid stimulating hormone receptor)
MGC75129, hTSHR-I, thyrotropin receptor-I, hTSHR-I
TSH, thyrostimuline LGR4 LGR4 (leucine-rich repeat-containing G
protein-coupled receptor 4)
GPR48 (G-protein-coupled receptor 48) ?
LGR5 LGR5 (leucine-rich repeat-containing G protein-coupled receptor 5)
FEX, GPR49 (G protein-coupled receptor 49), GPR67, GRP49, HG38, MGC117008
?
LGR6 LGR6 (leucine-rich repeat-containing G protein-coupled receptor 6)
FLJ14471, GPCR, VTS20631, gonadotropin receptor
?
LGR7 RXFP1 (relaxin/insulin-like family peptide receptor 1)
MGC138347, MGC142177 relaxine,
INSL7/relaxine-3 LGR8 RXFP2 (relaxin/insulin-like family peptide
receptor 2)
GPR106, GREAT, INSL3R, G protein coupled receptor affecting testicular descent
INSL3 (insuline- like 3) Mus
musculus
Lgr1 Fshr (follicle stimulating hormone receptor)
Follitropin receptor Fsh
Lgr2 Lhcgr (luteinizing
hormone/choriogonadotropin receptor)
Gpcr19-rs1, LH-R, Lhr Lh
Lgr3 Tshr (thyroid stimulating hormone receptor)
hypothroid, hyt, pet Tsh
Lgr4 Lgr4 (leucine-rich repeat-containing G protein-coupled receptor 4 )
9130225G07, A930009A08Rik, Gpr48 ?
Lgr5 Lgr5 (leucine rich repeat-containing G protein coupled receptor 5 )
FEX, Gpr49 ?
Lgr6 Lgr6 (leucine-rich repeat-containing G protein-coupled receptor 6)
A530037C04Rik, D830026M09 ?
Lgr7 Rxfp1 (relaxin/insulin-like family peptide receptor 1)
Gm1018, relaxin family peptide receptor 1 relaxine, Insl7/relaxine-3 Lgr8 Rxfp2 (relaxin/insulin-like family peptide
receptor 2)
Gpr106, Great (G protein coupled receptor affecting testicular descent)
Insl3 (insuline- like 3) Drosophila
melanogaster
DLGR1 Fsh-Tsh-like receptor Dmel_CG7665, CG7665, DLGR-1, DLGR1, FSHr, FSH-TSHr, Fsh/CG7665r, LH/CG receptor, Fsh-Tsh-like receptor CG7665-PA isoform A, Fsh-Tsh-like receptor CG7665-PB isoform B
GPA2+GPB5
DLGR2 rickets rk, Dmel_CG8930, BG:DS00180.13, CG8930,
CT25644, DLGR-2, DLGR2, LGR2, rk/CG8930,
bursicon
DLGR3 DLgr3 Dmel_CG31096, CG31096, CG5042,
CG5046, CT16193, DLGR3
?
DLGR4 DLgr4 Dmel_CG4187, DLGR4, DmLGR3 ?
Tableau A-5 : Les différentes dénominations des LGR chez l'humain, la souris et la drosophile, ainsi que
les agonistes naturels. ? : pas d'agoniste connu.
3.1.2 Ghra : un LGR de cnidaire
En 1993, Nothacker et Grimmelikhuijzen clonent pour la première fois chez un invertébré un gène ayant une très forte homologie de séquence avec ceux des récepteurs aux hormones glycoprotéiques.
En utilisant des oligonucléotides dérivés de séquences consensus de gènes de RCPG connus, ils amplifient chez l'anémone de mer Anthopleura elegantissima le gène Ghra (pour G protein-coupled hormone receptor from Anthopleura ). Il s'agit d'une protéine de 925 acides aminés, présentant une répétition de 9 motifs riches en leucines dans son domaine aminoterminal ainsi qu'un domaine 7 TM . Ce récepteur putatif présente environ 20 % d'identité dans son domaine N-terminal et environ 45 % d'identité dans la région à 7 domaines transmembranaires avec les RHG des mammifères ; la région intracellulaire est par contre très peu similaire à celles des gènes de RHG des mammifères. De plus, la partie aminoterminale de Ghra présente des répétitions riches en glycine inexistantes dans les RHG.
3.1.3 DLGR1 : L'homologue des RHG chez la drosophile
Chez la drosophile ( Drosophila melanogaster ), un seul gène homologue aux RHG a pu être mis en évidence. Ce récepteur (DLGR1) contient 9 motifs répétés riches en leucines et son domaine aminoterminal possède environ 20% d'identités avec ceux des 3 RHG de mammifères. Le gène DLGR1 a été cloné au moyen d'oligonucléotides dérivés de séquences consensus des RHG (Hauser et al. , 1997). La fonction de DLGR1 reste inconnue, bien qu'il semble impliqué dans le développement.
L'ARNm est en effet fortement exprimé à partir de la 8
eheure suivant l'oviposition. Ensuite, son niveau d'expression baisse fortement chez la femelle adulte tandis qu'il reste élevé chez le mâle adulte.
Un agoniste recombinant du récepteur DLGR1 a cependant pu être obtenu. Peu après avoir découvert l'existence dans le génome humain de deux gènes paralogues aux sous-unités α et β de la TSH (respectivement, les gènes α2 et β5 ) et montré que le produit des ces gènes pouvait former un hétérodimère (la thyrostimuline) capable d'activer le TSHr (Nakabayashi et al. , 2002), ce groupe a montré l'existence chez la drosophile de deux gènes orthologues à α2 et β5 ( GPA2 et GPB5 ).
L'hétérodimère formé par les sous-unités GPA2 et GPB5 de drosophile active la production d'AMPc
médiée par DLGR1 mais pas par DLGR2 ou TSHr (Sudo et al. , 2005).
Partie A - Introduction
3.1.4 nLGR : un LGR de nématode
En comparant les séquences des récepteurs aux hormones glycoprotéiques (RHG) de mammifères au génome du nématode Caenorhabditis elegans , Kudo et al. (2000) ont découvert et cloné un gène homologue aux RHG. Il s'agit d'une protéine de 929 acides aminés, présentant un domaine aminoterminal composé de 9 motifs répétés riches en leucines, un domaine 7 TM et une queue carboxyterminale relativement longue de 234 acides aminés. Le domaine 7 TM possède 30 % d'identités (50 % de similarités) avec les RHG de mammifères.
nLGR (pour L G R de nématode) possède une activité constitutive : des cellules de rein humain (293T) transfectées par un plasmide exprimant le récepteur présentent une augmentation du taux basal d'AMPc en l'absence de stimulation par un ligand, cette augmentation étant proportionnelle à la quantité de plasmide transfectée. Parallèlement, un récepteur chimérique dans lequel l'ectodomaine de nLGR est remplacé par celui du récepteur LH/CGr humain garde cette activité constitutive et est capable de lier l'hormone LH humaine. Ce récepteur chimérique n'est – par contre – pas stimulé par l'hCG (Kudo et al. , 2000).
3.2 Les LGR de type B
3.2.1 DLGR2 : le récepteur au bursicon
En comparant la séquence du gène DLGR1 avec le génome de drosophile, Eriksen et al. (2000) ainsi que Nishi et al. (2000) ont mis en évidence l'existence d'un second LGR chez D. melanogaster , présentant plus d'homologies que ce premier avec les RHG de mammifères (27% d'identités dans le domaine aminoterminal et 49 % d'identités dans le domaine 7 TM avec TSHr humain) : DLGR2. Il s'agit d'une protéine de 1050 acides aminés, présentant un domaine aminoterminal composé de 18 motifs répétés riches en leucines (LRR).
En 2002, Baker et Truman ont montré que l'inactivation du gène DLGR2 chez les drosophiles
conduisait à produire le phénotype rickets . Chez ces mutants, les étapes de durcissement et de
coloration de la cuticule – normalement déclenchées par la sécrétion de l'hormone bursicon –
n'apparaissent pas, bien que du bursicon soit produit. Par contre, l'injection d'AMPc – connu comme
étant le messager secondaire du bursicon – déclenche la coloration de la cuticule.
Partie A - Introduction
L'action du bursicon est connue depuis les années ’60 (Fraenkel et Hsiao, 1965 ; Fraenkel et al. , 1966). Cette neurohormone déclenche le durcissement et la coloration de la cuticule lorsque l'insecte adulte sort du stade pupe (exuviation adulte). A cet instant, le sang ne contient pas de bursicon et, si la tête est séparée du corps par une ligature, le corps ne se colore pas et la cuticule ne durcit pas. Par contre, l'injection du sang d'une mouche non ligaturée dans une mouche ligaturée provoque la coloration de cette dernière, ce qui montre que le bursicon est produit dans le cerveau de l'insecte lors de l'exuviation. Le bursicon induit également l'apoptose des cellules épithéliales des ailes lors de leur déploiement (Kimura et al. , 2004). Malgré ces observations, les tentatives de purification et d'identification de la nature du bursicon ont longtemps été infructueuses (Honegger et al. , 2002).
Finalement, Mendive et al. (2005) ainsi que Luo et al. (2005) ont mis en évidence l'agoniste de DLGR2 (voir également Vassart et al. , 2005). Ces deux groupes ont montré que chez la drosophile, l'hormone bursicon est un hétérodimère constitué de deux polypeptides de la famille des protéines à noeud cystine. Des cellules de rein de singe vert africain (COS-7) transfectées avec les deux gènes codant pour les sous-unités bursicon α et bursicon β produisent dans leur milieu de culture un dimère capable de stimuler l'augmentation du taux d'AMPc dans des cellules exprimant DLGR2 mais également d'induire la bio-activité bursicon chez des drosophiles. Des recherches d'homologies de séquences dans d'autres génomes d'insectes ont également montré que chez l'abeille ( Apis mellifera ), les deux sous-unités du bursicon sont codées par des ORF contiguës, alors que chez la drosophile, le ver à soie ( Bombyx mori ) et le moustique ( Anopheles gambiae ) les deux gènes sont séparés, à l'instar des sous-unités α et β des hormones glycoprotéiques (Mendive et al. , 2005 ; Van Loy et al. , 2007a).
DLGR2 est pour l'instant le seul LGR de type B dont la fonction et l'agoniste ont été déterminés.
3.2.2 Cg-LGRB : un LGR d'huître
En 2004, Herpin et al. ont cloné chez l'huître creuse le gène Cg-LGRB (pour Crassostrea gigas
L G R de type B). Cette protéine de 1094 acides aminés contient dans sa partie aminoterminale 18
motifs répétés riches en leucines (LRR), tout comme DLGR2. Cg-LGRB est faiblement exprimé dans
la plupart des tissus adultes et embryonnaires, fortement dans la glande digestive mais quasiment pas
exprimé dans les organes reproducteurs, ce qui est contraire aux LGR de mammifères.
Partie A - Introduction
3.2.3 LGR4, LGR5 et LGR6 : les LGR orphelins de mammifères
Entre 1998 en 2001, différents groupes ont mis en évidence dans les génomes de mammifères trois nouveaux gènes présentant de grandes similitudes avec ceux des récepteurs aux hormones glycoprotéiques (LGR5 humain : McDonald et al. , 1998 ; Lgr4 de rat et LGR5 humain : Hsu et al. , 1998 ; Lgr5 de souris : Hermey et al. , 1999 ; LGR6 humain : Hsu et al. , 2000 ; LGR4 humain : Loh et al. , 2000 et 2001). Ces trois gènes, respectivement LGR4, LGR5 et LGR6 (voir tableau A-5 pour leurs différentes dénominations) forment chez les vertébrés un sous-groupe de récepteurs de type LGR caractérisés par 17 motifs répétés riches en leucines, au lieu de 9 pour les RHG, présentant donc un domaine potentiel d'interaction avec leur(s) ligand(s) beaucoup plus grand.
NB : LGR4 fait l'objet d'un chapitre particulier, voir point 4, page 37.
3.2.4 LGR5 (GPR49 – HG38 – FEX)
Le gène LGR5 humain a tout d'abord été cloné (sous le nom de HG38 ) par McDonald et al.
(1998) au départ d'une EST (Expressed Sequence Tag) localisée en comparant la banque dbEST avec
des séquences de RCPG connues à l'époque. Ce même groupe a localisé le gène en position
12q22-23 et a observé son expression (par Northern blot) dans les muscles striés, le placenta, la
moelle épinière et plusieurs régions cérébrales. Quasi simultanément, Hsu et al. (1998) ont cloné le
gène LGR5 humain de façon similaire, et ont obtenu le même pattern d'expression (Northern blot) ;
ces derniers localisaient cependant erronément le gène en position 12q15. Quelques mois plus tard,
Hermey et al. (1999) ont cloné le gène Lgr5 de souris (nommé FEX, à cause de son expression
folliculaire) suivant une approche différente : amplifier un fragment de gène humain au moyen
d'amorces PCR dégénérées, séquencer le fragment, puis utiliser ces séquences pour dessiner des
amorces spécifiques et amplifier le gène correspondant chez la souris. L'expression du gène a été
testée chez l'adulte par hybridation in situ , mettant en évidence une expression dans l'ovaire (follicule
de Graaf, mais pas les follicules primaires et secondaires) et les testicules (tubules séminifères) ainsi
que dans la médullosurrénale et le bulbe olfactif (cellules granulaires et la couche des cellules
mitrales). L'expression au cours du développement a également été observée (à partir du stade E10.5,
dans le système nerveux central, avec de rapides changements dans le pattern d'expression). Plus
récemment, Morris et al. (2004) ainsi que Blanpain et al. (2004) ont observé une expression
particulièrement forte de LGR5 dans les cellules souches du follicule pileux ( bulge ), comparativement
aux cellules environnantes. Krusche et al. (2007) ont également observé (par RT-PCR en temps réel)
Partie A - Introduction
une légère expression de LGR5 dans les cellules épithéliales de l'endomètre humain et ce tout au long du cycle menstruel.
En 2004, Morita et al. ont généré une lignée de souris possédant un gène LGR5 dont le dernier exon (comportant le segment intermembranaire et le domaine intracellulaire) est remplacé par un marqueur lacZ/MC1 neo . Ces souris présentent une mortalité néonatale de 100% due à la fusion de la langue avec le plancher de la cavité buccale (ankyloglossie). Les nouveaux-nés sont incapables de téter correctement, on ne retrouve pas de lait dans l'estomac mais de l'air et une énorme distension gastro-intestinale.
3.2.4.1 Expression de LGR5 dans des cellules cancéreuses
Une surexpression de LGR5 a été observée dans trois types de cellules cancéreuses :
Yamamoto et al. (2003) ont observé (par RT-PCR quantitative en temps réel) dans les cellules de carcinomes hépatocellulaires humains (HCC) une surexpression de LGR5 fortement corrélée avec la présence de mutation(s) dans le gène de la β-caténine. La surexpression de LGR5 apparaît également dans des hépatocytes de souris lorsqu'une mutation est introduite dans le gène de la β−caténine. Cette surexpression a également été observée par Zucman-Rossi et al. (2007) après avoir induit des mutations gain de fonction dans le gène codant pour la β-caténine.
En 2006, McClanahan et al. ont détecté une surexpression de LGR5, par microarrays, RT-PCR quantitative en temps réel et immunohistochimie sur des tissus primaires de tumeurs colorectales et ovariennes. Ils ont également déterminé que, dans les tumeurs colorectales, cette surexpression était plus importante dans les tumeurs les plus avancées.
En 2006, Timson et al. ont observé par microarrays et RT-PCR quantitative en temps réel que LGR5 est l'un des quatre gènes les plus surexprimés dans des cas de leucémies lymphoblastiques infantiles des précurseurs B (ALL).
3.2.5 LGR6
Le gène LGR6 a été repéré dans le génome humain par homologies avec d'autres LGR puis
cloné en 2000 par Hsu et al. au départ de tissus d'ovaire et de testicule humain. La séquence du gène
Partie A - Introduction
position chromosomique a été déterminée en 1q32 et son expression observée par Northern blot dans le testicule, l'ovaire, l'oviducte, l'utérus, le thymus, l'intestin grêle, le côlon, la rate, le rein, la glande surrénale, le cerveau et le cœur.
3.3 Les LGR de type C
3.3.1 LGR7 et LGR8 : les récepteurs à la relaxine
Le gène LGR7 humain a été cloné en même temps que LGR6 par Hsu et al. (2000) au départ de tissus d'ovaires et de testicules. Le gène a été localisé en 4q32 et son expression observée de façon quasi ubiquitaire (à l'exception de la rate). Cette protéine de 757 acides aminés (forme longue) ou 723 acides aminés (forme courte) comporte dans son domaine aminoterminal 10 motifs répétés riches en leucines (LRR) et possède 24 % d'identités avec les RHG de mammifères.
Deux ans plus tard, Hsu et al. (2002) ont démontré que LGR7 est un récepteur à la relaxine, l'hormone responsable en fin de grossesse de la dilatation et la relaxation de l'utérus et de la symphyse pubienne ainsi que de la croissance et du développement de la glande mammaire (Ivel, 2002). Le très similaire LGR8 est également activé par la relaxine mais à des doses plus importantes que LGR7. La relaxine est une hormone formée de deux chaînes peptidiques de structure proche de l'insuline. Depuis le premier clonage de la relaxine (chez le rat, voir Hudson et al. , 1981), toute une famille de facteurs similaires ( INS uline- L ike peptides) ont été mis en évidence chez l'humain : RLN1 ( R e L axi N e 1), RLN2, RLN3/INSL7, INSL3/RLF, INSL4/EPIL, INSL5/RIF, et INSL6/RIF1 dérivant probablement tous d'un ancêtre RLN3 commun. Les membres de cette famille ont des rôles biologiques et des profils d'expression différents (Halls et al. , 2007).
Parallèlement, Overbeek et al . (2001) ont montré que des souris dont le récepteur Lgr8 (aussi appelé G REAT pour G-protein-coupled RE ceptor A ffecting estis descent) est inactivé possédaient le T
même phénotype de cryptorchidisme (défaut dans la descente des testicules) que des souris mutées dans le gène encodant INSL3 (Leydig insulin-like peptide ou encore relaxin-like factor). Kumagai et al. (2002) ont immédiatement montré que INSL3 activait effectivement le récepteur Lgr8 (mais pas Lgr7) chez la souris.
Finalement, Sudo et al. (2003) ont montré que la relaxine 3 humaine (relaxine H3) activait
LGR7 mais pas LGR8.
Partie A - Introduction
Ces deux récepteurs ainsi que deux autres RCPG récemment identifiés comme récepteurs à la relaxine-3 et à INSL5 ont été renommés de façon systématique RXFP n ( R elaxin F amily P eptide
R eceptors) : LGR7 = RXFP1, LGR8 = RXFP2, GPCR135 ( S omatostatin and ngiotensin- A L ike eptide P R eceptor, SALPR ; Matsumoto et al. , 2000 ; Liu et al. , 2003b) = RXFP3 et GPCR142 (GPR100 ; Boels et Schaller, 2003 ; Liu et al. , 2003a ; Liu et al. , 2005) = RXFP4.
3.3.2 GRL101, un LGR de gastéropode
En 1994, Tensen et al. ont cloné au moyen d'amorces PCR dégénérées (correspondant à des motifs conservés dans les segments TM VI et TM VII de plusieurs RCPG) un gène codant pour un LGR de la petite limnée ( Lymnea stagnalis , un mollusque gastéropode). Le produit du gène a été localisé par PCR quantitative dans le système nerveux central (et faiblement dans le cœur) ; l'hybridation in situ a, quant à elle, révélé une expression essentiellement au niveau des deux ganglions pédieux du système nerveux central et d'autres ganglions. La protéine GRL101, longue de 1095 acides aminés, contient dans sa région aminoterminale deux domaines constitués de motifs répétés. Le premier domaine, similaire au motif ‘classe A’ du domaine de liaison du récepteur LDL ( L ow D ensity L ipoprotein), contient 12 motifs répétés riches en cystéines, chacun contenant environ 40 acides aminés dont 6 cystéines à des positions fixes. Le second domaine, typique des LGR est constitué de 10 motifs répétés riches en leucines.
3.3.3 DLGR3 et DLGR4, deux autres LGR de drosophile
En 2002, Hsu et al. ont publié la séquence incomplète d'un LGR de type C chez la drosophile, sous le nom de DmLGR3 (données supplémentaires de l'article sur l'identification de LGR7 comme récepteur de la relaxine). Depuis, l'existence d'un gène nommé DLGR3 dans le génome de D. melanogaster ( Drosophila Genome Project, Adams et al. , 2000 ; http://www.flybase.org ; Crosby et al. , 2007) a plusieurs fois été évoquée par ce groupe (Hsu, 2003 ; Hsu, 2004 ; Luo et al. , 2005).
Son existence a finalement été éclaircie par Hauser et al. (2006) qui, en corrigeant les annotations des
banques de données ont mis en évidence l'existence des gènes DLGR3 et DLGR4 (la séquence de ce
dernier correspondant au DmLGR3 publié par Hsu et al. , 2002).
Partie A - Introduction
Figure A-7 : Région chromosomique humaine 11p14-p13 comportant le gène LGR4 . L'ensemble de la zone représentée s'étale sur 105 kb. Les exons sont numérotés et représentés à l'échelle selon le même schéma de couleur que la figure A-9.
Figure A-8 : Représentation graphique de la structure du domaine 7 TM du récepteur LGR4 humain.
Chaque domaine transmembranaire et chaque boucle sont représentés dans une couleur distincte.
Image « Snake-like » générée par Residue-based Diagram generato r (Institute for Computational Biomedicine, Weill Medical College of Cornell University), voir www.gpcr.org/7tm et Skrabanek et al. , 2003. Les ··· correspondent à des délétions effectuées automatiquement par le programme pour éviter des boucles trop longues.
1 2 3 4 5 6 7
89 1011
1213 1415
1617 18
...
D K V R P
F F V Y L V P N F P T L F L V C I P S S A L
K M I E P S I S S I A T I
L P F A S
F F A C P V F F I
C
...
C
N T F I L W A V H K I M S
I V V A M L L F A L L F L T L G V S V L N T ...
L S P T E G T P F P L C L P
F L L P F C G
A V A T G
L F A A L L A V R
F
...
F
Q K L H N S K G N K M I D
V T T A L M L L F E I S A S S F F V G A A L ...
A V K C G S G T E W W I G F
F T T L I
G T Y
I G M F L N
S V I S L G F F I
L K S S P L S T C S