• Aucun résultat trouvé

Si l’hypothèse principale pour expliquer l’information portée par les neurones dopamin-ergiques est aujourd’hui encore l’hypothèse d’erreur de prédiction de la récompense, une autre théorie portée notamment par Berridge semble avoir également une capacité ex-plicative de cette information. Cette théorie est que la dopamine encode la salience des événements et est liée à un renforcement motivationnel plus qu’à un signal d’apprentis-sage.

Dans les études présentées jusqu’à présent, le lien entre dopamine et comportement n’a pas été directement adressé. Nous avons vu que la dopamine et le comportement évoluent au cours de l’apprentissage mais pas le lien de causalité entre les deux. Si la dopamine encode une erreur de prédiction de la récompense et est, comme dans la théorie de l’apprentissage par renforcement, le signal d’apprentissage, alors une stimulation du système dopaminergique doit entraîner un apprentissage. Une critique principale que fait Berridge (Berridge 2007) est que, le fait que la dopamine encode un signal similaire à une RPE utilisée par les algorithmes TD, n’implique pas qu’elle ait le même rôle de signal de renforcement. Il faut vérifier si le comportement suit ou pas le lien de causalité dopamine→comportement, supposé par la théorie. La question n’est plus de savoir quel type d’information est encodé, mais plutôt quel est le rôle de cette information ? Le signal de RPE encodé par l’activité des neurones dopaminergiques est-il nécessaire pour l’apprentissage ou bien l’apprentissage forge-t-il le signal ? Il s’agit ici de savoir qui du signal dopaminergique ou de l’apprentissage est créé par le second.

Dans la littérature actuelle, il est encore difficile de déterminer la place exacte de la dopamine par rapport au comportement et si le signal dopaminergique est réellement un signal d’apprentissage ou non. Berridge 2007 passe en revue les différentes hypothèses de la dopamine et développe un argumentaire selon lequel la dopamine n’est pas un signal d’apprentissage mais un signal motivationnel, passant de l’hypothèse learning à l’hypothèse wanting.

Notons toutefois qu’après que Berridge a défendu son hypothèse, plusieurs études ont montré un lien de causalité entre dopamine et comportement (Kravitz et Huber2003; Steinberg et al. 2013). La dopamine est en effet suffisante pour créer une association stimulus-récompense et l’absence de dopamine affecte l’apprentissage. Cependant, il n’y a pas de lien quantitatif et graduel rigoureux entre dopamine et comportement. Pour être plus précis, comme nous le verrons dans les résultats du Chapitre 4, dans certaines études, l’évolution du signal dopaminergique ne semble pas indiquer la même vitesse d’évolution que celle du comportement ; il semble au contraire que la vitesse d’adaptation du comportement observée expérimentalement s’explique mieux comme le résultat d’une influence de plusieurs systèmes d’apprentissage et de décision dont un seul des systèmes

serait celui impliquant les signaux RPE dopaminergiques.

L’hypothèse de Berridge est que la dopamine encode la salience et augmente l’envie, la motivation pour l’obtention de la récompense (Berridge2007). Il faut ainsi dissocier la notion de plaisir de l’envie. Dans un grand nombre d’études, la dopamine a été interprétée comme encodant une composante hédonique de la récompense ce qui a mené à l’hypothèse portée par Wise (Wise 1985). Dans le contexte de l’hypothèse d’encodage de la salience, la dopamine code pour un signal motivationnel sans composante hédonique.

On peut considérer le wanting comme l’envie qu’a une personne souffrant d’addiction de consommer de la drogue. La consommation ne procure pas forcément du plaisir, mais le besoin de la consommer est grand. Ce besoin se traduit ainsi en wanting et non en liking. La cocaïne entraînant l’arrêt de la recapture de la dopamine, entraîne une augmentation progressive de la concentration dopaminergique dans les synapses et une motivation sur-dimensionnée à la consommation de la drogue.

Cependant, ce phénomène d’addiction peut également s’expliquer avec l’hypothèse de l’erreur de prédiction (Keramati et Gutkin 2013; Redish 2004). L’augmentation dis-proportionnée du niveau dopaminergique entraîne un renforcement grandissant de la valeur associée à la consommation de la drogue conduisant à un comportement addic-tif.

Pour déterminer le rôle de la dopamine entre apprentissage et motivation, il faut prendre en compte l’évolution du comportement liée à la dopamine. Berridge et collègues se basent sur la considération que si la dopamine joue un rôle dans l’apprentissage et non dans la motivation, alors un changement lié à l’activation de la dopamine sera plus long puisqu’il nécessitera un temps d’apprentissage. Si au contraire la dopamine est liée à un signal motivationnel, alors le changement sera plus immédiat (voir Figure2.10).

Ils montrent par exemple que lorsqu’un animal apprend une contingence entre un CS et un résultat négatif, le fait de rendre le résultat soudainement attractif entraîne un change-ment comportechange-mental immédiat chez l’animal. Sa motivation nouvelle lui fera montrer une réponse inconditionné d’envie face au CS de façon quasi-instantanée. Cela met en év-idence le fait que le changement de comportement ne se fait pas après un réapprentissage de la valeur du CS, mais est immédiate et due à un changement motivationnel face à la récompense.

Cependant, ce constat est possiblement critiquable dans le sens où l’apprentissage de la contingence CS-US peut se faire de manière liée à l’homéostasie. Ainsi, la valeur ap-prise peut dépendre de l’état physiologique de l’animal. L’apprentissage porte alors sur le type de récompense et l’effet qu’elle aura sur l’état de l’animal. Le fait que celle-ci devi-enne désirable créera un changement immédiat. De plus ce type de changement brutal de comportement peut être dû à une décision corticale n’empêchant pas un processus sous cortical de désapprentissage plus lent (cela peut être le cas avec l’hypothèse de change-ments contextuels – task set – développée notamment par Collins et Koechlin ; Collins

2010).

Un autre constat de Berridge est que la dopamine n’est pas nécessaire à l’apprentis-sage. Certaines études ont montré que des souris incapables de synthétiser de la dopamine ont des capacités d’apprentissage (Cannon et Palmiter 2003). Ces résultats mettent

!

"

#

$

$

!

#

Figure 2.10 – Illustration du changement comportemental pour l’hypothèse motivationnelle ou lié à l’apprentissage après avoir rendu un résultat attractif. Figure reproduite de Robinson et

Berridge 2013.

en évidence le fait que l’apprentissage n’est pas forcément porté par la dopamine. De plus, des études d’apprentissage chez des souris ayant un niveau dopaminergique élevé montrent que l’augmentation de la concentration en dopamine crée une augmentation de la motivation pour l’obtention de la récompense mais n’augmente pas les capacités d’apprentissage liées à la récompense (Yin et al. 2006). Ainsi, il est probable qu’il y ait plusieurs systèmes d’apprentissage et de décision ; possiblement un cortical moins sensible au signal dopaminergique et un sous cortical (Lesaint et al. 2014).

La relation entre dopamine et comportement est donc possiblement plus complexe qu’initialement prédite par l’hypothèse de RPE de Schultz et collègues. L’optogénétique est une technique permettant chez des souris ou rats mutant(e)s d’activer de façon sélec-tive certaines populations de neurones à l’aide d’une activation lumineuse sans changer l’activité des neurones environnants. Cette technique a permis de montrer que l’activation de neurones dopaminergiques seule permet de renforcer une association entre un stimu-lus et une récompense. Notamment, Steinberg et al. 2013, montrent que l’activation du système dopaminergique permet de supprimer le blocage de l’association stimulus-récompense lorsque celle-ci est déjà prédite par un premier stimulus6

. Ce résultat montre que la dopamine seule est suffisante pour créer une association CS-US (sans forcément dire qu’elle est nécessaire, puisqu’un autre mécanisme d’apprentissage pourrait faire cette as-sociation dans une autre partie du cerveau ; Daw et al.2005; Khamassi et Humphries

2012). Cela permet de montrer que la dopamine seule peut être la conséquence d’un

6. Le blocking est un phénomène qui fait qu’un stimulus ne peut être associé à une récompense si il est couplé avec un autre stimulus prédisant déjà cette récompense.

changement comportemental.

Ainsi, on est en droit de penser que la dopamine permet de renforcer des comporte-ments, bien que tous les comportements ne soient pas nécessairement la conséquence d’un apprentissage lié à la dopamine.

On notera que McClure et al. 2003 ont proposé que la dopamine fasse la passerelle entre liking et wanting. Ils émettent l’hypothèse que le signal dopaminergique est à la fois utilisée comme signal d’apprentissage au niveau phasique et est utilisée comme un biais pour la sélection de l’action au niveau tonique. Le niveau tonique de la dopamine, biaisant la sélection, étant la composante motivationnelle de la dopamine.