• Aucun résultat trouvé

Avant-propos

Chapitre 2 Le système dopaminergique

La dopamine (DA) est un neuro-modulateur impliqué dans de nombreuses fonctions cérébrales parmi lesquelles : le contrôle moteur, les émotions, l’apprentissage, la prise de décision, la motivation, les tâches cognitives et de manière générale dans la réactivité d’un individu à un environnement changeant58–61. Son importance fonctionnelle est aussi mise en évidence par le nombre de pathologies impliquant la DA, telle que la maladie de Parkinson, la Schizophrénie, le syndrome Gilles de la Tourette, les troubles obsessionnels compulsifs (TOC), la dépression ou encore les addictions62–64.

2.1 La dopamine et les récepteurs dopaminergiques

La DA appartient à la famille des catécholamines. Comme l’adrénaline et la noradrénaline, elle est synthétisée à partir d’un acide aminé : la L-tyrosine. Ce dernier va être converti en L-DOPA (L-dihydroxyphenylalanine) sous l’action de l’enzyme Tyrosine-3-Hydroxylase (TH). Puis la L-DOPA est à son tour convertie en DA par l’enzyme dopa-decarboxylase (Figure 2.1)65.

42

La DA ainsi produite est alors transportée dans des vésicules par action des transporteurs vésiculaires des monoamines (VMAT, vesicular monoamine transporter). La DA, libérée par exocytose des vésicules, agit sur des récepteurs métabotropes66. On distingue deux grandes familles de récepteurs dopaminergiques : le groupe D1-like et le groupe D2-like. Bien que très proches structurellement ces deux familles diffèrent au niveau des voies de signalisation engagées ainsi qu’au niveau de leurs propriétés pharmacologiques. La sous-classe D1-like comprend les récepteurs D1 et D5 qui sont excitateurs. Ils sont couplés à des protéines G hétérotrimèriques Gas et GaOlf qui activent l’adénylate cyclase provoquant ainsi une augmentation de la concentration d’AMPc (adénosine mono-phosphate cyclique) et l’activation de la protéine kinase A (PKA). La sous-classe D2-like comprend quant-à-elle les récepteurs D2, D3 et D4 qui sont inhibiteurs. Ils sont couplés à une protéine Gai ou Gao qui va inhiber la formation d’AMPc, limitant ainsi l’activation de la PKA et va en parallèle favoriser l’ouverture des GIRK, des canaux K+ activés par les protéines G, entraînant une hyperpolarisation. La DA va moduler l’excitabilité des neurones cibles en activant des cascades intracellulaires, en modulant la transmission synaptique et l’expression de certains gènes66. La DA en excès dans le milieu extracellulaire est recapturée par les neurones DAergiques grâce à la présence du transporteur de la DA (DAT).

2.2 Anatomie du système dopaminergique

Les connaissances anatomiques des noyaux catécholaminergiques reposent sur l’étude de l’expression de la TH, enzyme clé dans la synthèse de la DA67–69. On retrouve de nombreux noyaux catécholaminergiques dans le cerveau notés A1 à A17. Les études en voltamétrie cyclique et plus récemment en optogénétique ont permis d’établir que parmi ces noyaux, seuls les noyaux A8 à A17 libèrent de la DA. La signalisation DAergique dans le cerveau repose principalement sur trois grands noyaux : le champ rétro-rubral (A8), la substance noire pars

compacta (SNc, A9) et l’aire tegmentale ventrale (VTA, A10) tous les trois situés au niveau

du mésencéphale70 (Figure 2.2A). La SNc projette massivement sur le striatum dorsal et joue un rôle clé dans le contrôle moteur et la mémoire procédurale. Au cours de cette étude, nous nous intéresserons principalement à la VTA, qui joue un rôle majeur dans l’apprentissage par renforcement, la prise de décision et la motivation. Son fonctionnement est détourné par la plupart des drogues d’abus, conduisant à un renforcement aberrant et à l’addiction. Cette dernière projette principalement sur le striatum ventral (NAc), le PFC et l’amygdale71. On retrouve aussi des neurones DAergiques au niveau du noyau arqué de l’hypothalamus, ces

43

neurones DA dits « de la voie tubéro-infundibulaire » (neurones TIDA) libèrent de la DA dans le système sanguin porte hypophysaire. La DA à ce niveau joue d’importants rôles dans la régulation des fonctions endocrines et dans le contrôle de la reproduction72.

Figure 2.2 – Anatomie des voies DAergiques (A) et de l’aire tegmentale ventrale chez le rat (VTA, B)73 : (A) SNC = partie compacte de la substance noire, VTA = aire tegmentale ventrale.

(B) aopl = tractus optique accessoire, aVTA = aire tegmentale ventrale antérieure, CLi = n. linéaire caudal, IF = n. interfasciculaire, IP = n. Interpédonculaire, ml = lemnisque médian, mp = pédoncule mammilaire, R = n. Rouge, RLi = n. linéaire rostral, scp = pédoncule cérébelleux supérieur, SNC = partie compacte de la substance noire, SNL = partie latérale de la substance noire, SNR = partie réticulée de la substance noire, MT = n. Médial terminal du tractus optique accessoire , PBP = n. parabrachial pigmentosus, PN = n. latéral paranigral, pVTA = aire tegmentale ventrale postérieure.

La VTA est une structure hétérogène composée de 5 noyaux (Figure 2.2B) : parmi eux le noyau latéral paranigral (PN) et le noyau parabrachial pigmentosus (PBP) présentent les plus fortes densités de neurones DAergiques. Le noyau interfasciculaire (IF), le noyau linéaire rostral (RLi) et le noyau linéaire caudal (CLi) sont plus médians et présentent une plus faible proportion de neurones DAergiques. Au niveau de la VTA, on retrouve trois grandes populations de neurones :

44

- Les neurones DAergiques représentent 60% des neurones de la VTA. Le critère de choix pour les identifier est l’expression de la tyrosine hydroxylase. Ils peuvent aussi être identifiés sur la base de critères électrophysiologiques qui leurs sont propres74–76. Ils sont principalement concentrés au niveau du PBP et du PN69.

- Les neurones GABAergiques (libérant de l’acide g-amino-butyrique, GABA) représentent environ 30% des neurones de la VTA et peuvent être soit des interneurones inhibiteurs locaux, soit des neurones de projection ciblant principalement le nucleus accumbens (NAc), le cortex préfrontal (PFC) et l’habénula latérale (lHb)77,69. L’identification de ces neurones a été possible grâce à des travaux d’hybridation in situ pour les ARNm codant pour l’enzyme acide glutamique decarboxylase (GAD) nécessaire dans la voie de synthèse du GABA. L’inhibition des neurones DAergiques de la VTA par le GABA implique deux types de récepteurs GABAA et GABAB. Il a été proposé que les récepteurs GABAA soient impliqués dans l’inhibition mettant en jeu les interneurones locaux tandis que les récepteurs GABAB seraient eux la cible des afférences GABAergiques projetant sur la VTA78.

- Les neurones glutamatergiques représentent la proportion restante de neurones de la VTA (<10%). Leur identification se base sur la présence d’ARNm codant pour le transporteur vésiculaire du glutamate (VGLUT2)79. Ces neurones sont retrouvés dans la partie la plus médiale de la VTA, principalement dans l’IF, le RLi et le CLi. Plus récemment, des travaux en optogénétique ont permis d’identifier une voie directe glutamatergique entre la VTA et le NAc. Les potentiels post-synaptiques excitateurs (EPSP) évoqués par la photostimulation des neurones glutamatergiques de la VTA dans les neurones du NAc sont abolis par l’application de bloqueurs des récepteurs du glutamate. Cette transmission glutamatergique directe entre la VTA et le NAc pourrait en parallèle de la DA venir appuyer les mécanismes de plasticité impliqués dans l’apprentissage par renforcement80.

2.3 Hétérogénéité de la VTA

Ces dernières années, à plusieurs reprises des exemples de co-transmissions sont venus contester cette description de la VTA. Notamment une fraction des neurones DAergiques de la VTA expriment, en plus de la TH, VGLUT281–84. Ces neurones pourraient ainsi libérer à la fois de la DA et du glutamate. Ces neurones sont principalement localisés dans la partie la plus médiale de la VTA. Des expériences d’optogénétique ont permis de montrer que la

45

photostimulation des neurones DAergiques uniquement, chez des souris DATiCre (souris transgéniques exprimant la Cre-recombinase codon-optimisée sous le contrôle du promoteur DAT), pouvait entrainer l’apparition de courants post-synaptiques excitateurs (EPSC) glutamatergiques dans les neurones du striatum et surtout dans les neurones pyramidaux du PFC85–87. Le croisement de lignées transgéniques (DATiCre et VGLUT2lox) a permis de déterminer le rôle de cette co-transmission à l’échelle comportementale88. Par ailleurs, des mécanismes similaires ont été mis en évidence pour le GABA. En effet, certains neurones DAergiques expriment l’enzyme GAD65/67 nécessaire à la synthèse du GABA et des travaux de physiologie en tranche de cerveaux de souris utilisant l’optogénétique ont permis de mettre en évidence une co-libération de DA et de GABA. Ces travaux indiquent en outre que le GABA peut être inclus dans les vésicules synaptiques par le biais du transporteur vésiculaire des monoamines (VMAT2) indépendamment de la présence de son propre transporteur vésiculaire (VGAT)89–92. Ces mécanismes de co-libération viennent enrichir la palette d’effets qu’auront les neurones DAergiques sur leurs cibles et notamment élargir le répertoire de mécanismes synaptiques engagés dans l’apprentissage par renforcement.

L’ensemble des afférences et efférences de la VTA et de la SN constituent un réseau complexe71. Historiquement, les techniques d’immuno- et cyto-chimie ont permis d’identifier deux grands faisceaux DAergiques. Le premier, appelé nigro-strié relie la partie compacte de la SN (SNc) au striatum dorsal. Le second, appelé méso-cortical englobe l’ensemble des fibres DAergiques prenant leur origine au niveau du mésencéphale et aboutissant au niveau du cortex93. Les travaux de Phillipson ont permis d’identifier à l’aide de traçages rétrogrades un faisceau dit méso-limbique connectant la VTA au striatum et, plus précisément, sa partie ventrale : le noyau accumbens (NAc)94–96. Plus récemment, des techniques de traçage rétrogrades plus performantes ont permis de confirmer la richesse des connexions de la VTA. Enfin, le développement ces dernières années de traceur viraux performants a conduit à l’établissement d’une cartographie exhaustive des afférences présentes sur les neurones DAergiques de la VTA et de la SNc97,71. La VTA reçoit de très nombreuses afférences en provenance de diverses structures cérébrales. Parmi les afférences majeures, on distingue les afférences en provenance du PFC (glutamatergiques et GABAergiques)98, de la lHb99, du noyau pré-optique latéral, du pallidum ventral (VP), du septum latéral, de la diagonale de Broca, du noyau basal de la strie terminale (BNST)100,101, les projections sérotoninergiques du raphé, du noyau supramamillaire102, des noyaux latéraux de l’hyptohalamus99, du colliculus supérieur103

46

tegmentum (LDT) et, dans une moindre mesure, du noyau pédonculo-pontin (PPN) qui innerve préférentiellement la SN. Ces deux dernières projections, en provenance du pont, constituent la principale source d’ACh au niveau de la VTA. Il a été montré en outre que les projections du LDT innervaient préférentiellement les interneurones GABAergiques de la VTA104.

En sortie, les principales cibles des neurones dopaminergiques sont les cortex frontaux (OFC et PFC), le striatum (NAc et DS), l’amygdale, le cortex moteur, le septum latéral, le VP, le locus coeruleus, le cortex enthorinal et l’hippocampe, notamment au niveau du subiculum ventral et de CA1 et CA397,71.

2.4 Activité spontanée des neurones dopaminergiques de la VTA

Les neurones DAergiques de la VTA présentent deux patrons de décharge :

- Un patron de décharge régulier qualifié de pacemaker (Figure 2.4A), relativement lent. Plusieurs conductances sont mises en jeu pour l’induction et le maintien de ce type de décharge. Le potentiel d’action (PA) active les canaux calciques voltage-dépendants (voltage-gated calcium channels, VGCC). L’entrée de calcium qui en résulte va activer les canaux SK avec pour conséquence une hyperpolarisation du neurone. Cette hyperpolarisation entraîne à son tour l’ouverture des canaux HCN. Le courant entrant, appelé Ih, permet une correction de potentiel de membrane et un retour progressif qui, soutenu par les VGCC permet d’atteindre à nouveau le seuil de déclenchement d’un nouveau PA. L’action des canaux HCN est contrebalancée par l’ouverture des canaux potassiques voltage-dépendants (canaux Kv) qui ralentit la repolarisation de la membrane. Ce type de décharge lent et régulier implique une libération de DA faible et constante. Ce tonus DAergique va aussi avoir un effet localement sur les récepteurs

D2-like et l’auto-inhibition continue qui en résulte participe à la modulation de l’activité

des neurones DAergiques.

- Un patron de décharge plus irrégulier « en bouffées » dit « burstant » qui se

caractérise par la présence de bouffées de potentiels d’action ou bursts (Figure 2.4B). Ces bouffées ne sont pas observées ex vivo en tranche de cerveau, suggérant un

rôle critique des afférences dans la mise en place de ce type de décharge105. Ces bouffées, décrites dans les années 80 par Grace et Bunney74, se définissent de la manière

47

suivante : un intervalle inter-spike (ISI) inférieur à 80 ms marque l’entrée dans la bouffée et un ISI supérieur à 160 ms signe la fin de la bouffée (Figure 2.4C). D’autres critères pour définir les bouffées des neurones DAergiques ont été proposés106, cependant dans le reste de cette étude, nous conserverons les critères historiques établis par Grace et Bunney pour décrire les bouffées. L’activité en bouffées entraîne un relargage de DA massif, dans des échelles de temps courtes. Il a été proposé que cette libération transitoire, phasique, de DA joue un rôle fondamental dans les processus d’apprentissage par renforcement.

Les neurones DAergiques de la VTA peuvent aussi se trouver dans un état hyperpolarisé dans lequel ils n’émettent aucun potentiel d’action, on parle de neurones « silencieux ». Leur proportion dans la VTA est estimée à environ 50% des neurones DAergiques. La présence de ces neurones silencieux offre au système DAergique une grande marge de réactivité lors de l’exposition dans l’environnement à un stimulus particulièrement saillant107. Ces neurones seraient maintenus dans leur état hyperpolarisé par les afférences inhibitrices du VP. La levée d’inhibition par les afférences GABAergiques en provenance de l’hippocampe et du nucleus accumbens sur le VP permettrait une transition du mode de décharge des neurones DAergiques du mode régulier vers le mode burstant108.

Plus généralement, de manière empirique il a été déterminé que la fréquence de décharge des neurones DAergiques est comprise entre 1 et 10 Hz. Chez la souris anesthésiée, les patrons d’activité des neurones DAergiques sont assez variables. Deux grands paramètres sont utilisés pour décrire cette activité spontanée : 1) la fréquence de décharge (firing rate) calculée en fenêtres glissantes sur un enregistrement d’au moins 200 secondes et 2) le pourcentage de PA inclus dans des bouffées (% of spikes within bursts, %SWB). Quatre profils d’activité spontanée sont alors observés pour les neurones DAergiques109 (Figure 2.4D):

- Les neurones ayant une faible fréquence de décharge et un faible pourcentage de PA inclus dans des bouffées (low firing, low bursting, LFLB)

- Les neurones présentant une faible fréquence de décharge mais avec un grand pourcentage de PA dans des bouffées (LFHB)

- Des neurones présentant une forte fréquence de décharge avec peu de PA dans des bouffées (HFLB)

48

- Enfin des neurones présentant une fréquence de décharge élevée ainsi qu’un pourcentage de PA contenus dans des bouffées élevé (HFHB)

Figure 2.3 – Activité spontanée des neurones DAergiques de la VTA : (A) Trace

représentative d’un neurone DAergique présentant une activité in vivo régulière de type « pacemaker ». (B) Trace représentative d’un neurone DAergique présentant une activité in

vivo en bouffées. (C) Critère de définition de la bouffée d’après Grace & Bunney, 198474 (D)

Les neurones DAergiques de la VTA présentent 4 types d’activité spontanée, ces clusters sont basés sur leur fréquence de décharge et le pourcentage de PA dans des bouffées (d’après

Mameli-Engvall, 2006)109.

2.5 Dopamine et renforcement

Le cerveau doit sans cesse s’adapter à un environnement changeant et réagir à des évènements nombreux et souvent imprédictibles. Une des grandes théories de la neurophysiologie, étayée par de nombreuses études expérimentales, place la DA au centre des mécanismes d’apprentissage et des mécanismes dits de « prise de décision »59–61,110–113. Pour s’adapter à cet environnement changeant, le cerveau associe aux éléments de l’environnement une valence positive ou négative, on parle d’outcome. L’exploration de l’environnement et la confrontation à de nouvelles situations fait bouger les lignes de cette « valence ». Cela doit nécessairement reposer sur un système d’apprentissage flexible.

49

Introduit par Pavlov au début du siècle dernier, la notion de « renforcement » décrit les mécanismes par lesquels la probabilité qu’un comportement donné soit reproduit augmente au fil des essais : on parle d’apprentissage associatif ou encore d’apprentissage « par renforcement ». Dans ses expériences chez le chien, Pavlov associe un son à une récompense. Dans ce cas, la récompense est de la nourriture. Pavlov observa que l’association faite entre l’indice (le son) et la récompense (la nourriture) implique un changement de comportement de type « prédictif » puisque le son est associé à la récompense. A partir de ces observations, tout un champ de recherche s’est intéressé à comprendre comment le cerveau traite ces informations, quels neurones et quels substrats chimiques sont impliqués et comment ces mécanismes sont perturbés chez les patients atteint de maladies psychiatriques.

Les expériences de stimulations électriques intra-crâniales (ICSS) de Olds et Milner en 1954 ont permis pour la première fois de faire un lien entre récompense et DA. Lors d’une expérience dont le but était de mettre en évidence un effet aversif de l’ICSS ; ils ont observé que lorsque l’électrode de stimulation était placée dans certaines zones la conséquence n’était pas un évitement mais qu’au contraire, les rats répétaient la stimulation frénétiquement, délaissant même parfois des récompenses naturelles telles que la nourriture ou l’eau de boisson114. Ces travaux ont permis d’établir les bases d’une neuro-anatomie du renforcement. Plus tard, l’utilisation de bloqueurs pharmacologiques des récepteurs DAergiques a permis de mettre en lien le renforcement et la DA. En effet, consécutivement à l’injection de ces bloqueurs les animaux s’auto-administrent moins l’ICSS, indiquant que la signalisation DAergique est cruciale dans l’évaluation de la récompense et dans l’établissement du renforcement115. En parallèle, des études ont montré que l’injection d’amphétamines (qui augmentent la transmission DAergique) potentialise l’apprentissage par renforcement et augmente le nombre d’ICSS chez le rat. L’utilisation de bloqueurs des récepteurs DAergiques permet de contrer les effets des amphétamines sur le niveau d’activité des animaux. Ces travaux menés dans les années 1960 permettent d’établir un premier lien entre la transmission DAergique, la notion de renforcement/récompense et l’effet des drogues d’abus116. Le lien entre DA et addiction est aujourd’hui supporté par de nombreuses collections de données. Parmi un corpus fourni d’études sur ce sujet, les travaux menés en microdialyse et permettant d’évaluer la libération de DA dans les structures cibles ont permis de montrer que toutes les drogues d’abus impliquent un relargage accru de DA, plaçant ce neuro-modulateur au centre du renforcement aux drogues et donc au centre des mécanismes conduisant à l’addiction117.

50

2.6 Corrélats neurophysiologiques du renforcement

Depuis les travaux évoqués précédemment, de nombreuses études se sont attelées à mesurer les niveaux d’activité du système DAergique à la fois dans un contexte de récompense naturelle (nourriture, interactions sociales, sexe, etc.) ou bien en réponse aux drogues d’abus. Ces observations sont principalement de deux types : l’observation de l’activité électrophysiologique des neurones DAergiques d’une part et la mesure des fluctuations des niveaux extracellulaires de DA. Parmi les nombreuses observations faites au cours des cinquante dernières années, on note par exemple que l’absorption de glucose per os entraîne une augmentation de la libération de DA dans le striatum118, ou encore que l’interaction sociale avec des congénères du sexe opposé entraîne, elle aussi, une augmentation de la libération de DA dans le striatum119. Ces observations suggèrent qu’une récompense naturelle implique donc fortement un message DAergique. De manière intéressante, plusieurs études ont montré l’existence d’un pic phasique de libération de DA précédant la présentation de la récompense au moment, par exemple, d’un indice environnemental qui précède la récompense120,119. Ceci suggère un rôle prédictif de l’activité DAergique et remet en question le rôle de la DA dans ce circuit de la récompense, suggérant que les messages DAergiques pourraient être de natures diverses, portant à la fois une valeur hédonique en réponse à la présentation de la récompense mais aussi une valeur motivationnelle et anticipative, nécessaire pour l’initiation de l’action et la réactivité à l’environnement. Les travaux de Wolfram Schultz et collègues dans les années 1980, ont permis de formaliser le rôle prédictif de la DA, lui conférant ainsi un rôle computationnel110,111,121. En effet, Schultz observa dans un premier temps que chez le singe, l’activité électrophysiologique des neurones DA est fortement augmentée consécutivement à l’obtention d’une récompense, sans apprentissage préalable (une goutte de jus d’orange dans ce cas, Figure 2.4A). Cependant, si l’obtention de cette récompense est associée à un indice