• Aucun résultat trouvé

L’abeille est un modèle influent dans l’étude des bases moléculaires et cellulaires de la mémoire, qui ont surtout été étudiées grâce au conditionnement olfactif appétitif de la REP (Bitterman

et al., 1983 ; Menzel, 1990, 2001 ; Sandoz et al., 1995 ; Matsumoto et al., 2014). On ne sait cependant

que très peu de choses concernant la mémoire olfactive établie à la suite d’un conditionnement aversif. Bien que le protocole de conditionnement aversif différentiel que nous avons développé nous ait permis d'étudier différentes composantes de l'apprentissage, aussi bien sur le plan génotypique que comportemental (Chapitres I et III), il ne nous a pas permis de progresser dans la description des différentes phases de la mémoire aversive. Les seuls travaux existant à ce jour ont été réalisés sur la base du protocole utilisant un choc électrique comme stimulus inconditionnel (Giurfa et al., 2009). Les auteurs ont montré que consécutivement à une phase d'acquisition comprenant 6 essais renforcés (SC+) et 6 essais non-renforcés (SC-), les abeilles se souvenaient de l'information apprise jusqu'à 72 h après l'acquisition (mémoire à long terme tardive). De plus, par une approche neuropharmacologique basée sur l’injection d'inhibiteurs de transcription (actinomycine D) et de traduction (anisomycine), ils ont pu observer que cette mémoire dépendait d'une synthèse protéique de novo, comme la mémoire équivalente mise en place après un conditionnement appétitif (Giurfa et al., 2009). Cependant, de nombreuses questions restent en suspens, notamment : retrouve-t-on les différentes phases de la mémoire observées avec le protocole de conditionnement de la REP (mémoire à court ou à moyen terme) ? Si oui, quelles en sont les bases neuronales et moléculaires?

Il y a des raisons objectives qui expliquent la difficulté à étudier la mémoire avec les protocoles aversifs (que le renforcement soit un choc électrique ou thermique). Le fort taux de réponses spontanées observé en début de conditionnement (habituellement 20%) ainsi que le faible pourcentage d'individus apprenant spécifiquement l'odeur renforcée obligent à réaliser un conditionnement comprenant un nombre d'essais relativement élevé (Vergoz et al., 2007 ; Roussel et

al., 2009 ; Carcaud et al., 2009 ; Giurfa et al., 2009 ; Junca et al., 2014). Ce biais rend très difficile

l’étude des limites critiques des phases précoces de la mémoire aversive, qui, dans la modalité appétitive, sont étudiées après un seul essai de conditionnement, c’est-à-dire une seule association odeur-sucre (Menzel 1990 ; Sandoz et al., 1995). De surcroit, l’apprentissage aversif est réalisé le plus

souvent dans le cadre d’un conditionnement différentiel, dans lequel une odeur est présentée associée au renforcement aversif (CS+) alors qu’une autre odeur est présentée explicitement sans ce renforement (CS-). Les travaux récents suggèrent que dans ce type de conditionnement, deux types de mémoires sont créées. D’une part une mémoire aversive (CS+), l’odeur signalant la présence du renforcement négatif. D’autre part, une mémoire plutôt de type appétitive (CS-), l’odeur signalant l’absence de renforcement négatif (Tanimoto et al., 2004 ; Yarali et al., 2008 ; Carcaud et al., 2009). Nous pensons que la recherche de l'engramme aversif ne peut se réaliser dans des conditions où deux situations antagonistes sont apprises simultanément. Ainsi, pour progresser dans ce domaine, le développement d'un protocole de conditionnement absolu (ne comprenant qu'un stimulus conditionnel renforcé) devrait être envisagé. Afin de comprendre les limites des protocoles utilisés jusqu'à présent et de proposer des améliorations, deux approches sont possibles :

- soit appréhender le conditionnement de la RED comme un calque aversif du conditionnement appétitif de la REP et donc trouver les divergences entre les deux protocoles utilisés et qui pourraient expliquer le faible taux de réussite de l'apprentissage aversif.

- soit comprendre la RED comme une réponse sélectionnée différente de la REP, et donc potentiellement adaptée à d'autres conditions environnementales et qui pourrait répondre à d'autres règles pour être conditionnée efficacement.

Lorsque l'on se positionne dans la première hypothèse, la première différence importante, existant entre les protocoles classiques de conditionnement aversif de la RED et de conditionnement appétitif de la REP, réside dans l'application du stimulus inconditionnel. Si dans le premier cas l'embout conique chauffé est appliqué uniquement au niveau des pièces buccales (Junca et al., 2014 ; Chole et al., in prep; Junca et al., in prep), dans le second la solution sucrée est d'abord appliquée sur les antennes, stimulation qui déclenche la REP, et est ensuite mise en contact avec le proboscis afin que l’abeille puisse l’ingérer (Bitterman et al., 1983 ; Menzel, 2001 ; Giurfa et al., 2007). Ainsi dans le protocole de la REP, le stimulus inconditionnel est dit « composé » et se présente comme un double renforcement. Dans ce protocole appétitif, les performances sont nettement moindres lorsque la stimulation sucrée est apposée uniquement au niveau des antennes ou du proboscis (Bitterman et al., 1983 ; Sandoz et al. 2002) ce qui pourrait expliquer, par analogie, les moindres performances du conditionnement aversif, réalisé avec une application unique du SI. De façon intéressante, le dard pourrait être la cible d’un deuxième renforcement dans le conditionnement aversif, comme le proboscis l' est pour le conditionnement appétitif. La finalité écologique de la RED est de piquer une cible particulière, comme le suggère l'arsenal mécano-sensoriel présent sur le dard. Un ensemble de sensilles campaniformes sont réparties le long du dard et les neurones mécanosensoriels qu'elles renferment envoient un message sensoriel au ganglion abdominal terminal, permettant de contrôler localement l’action du dard (Ogawa et al., 2011). Il est possible que ce système mécano-sensoriel envoie au cerveau l’information selon laquelle le dard a piqué dans un substrat, i.e. un potentiel

deuxième renforcement. Ce système de retour mécano-sensoriel a aussi été observé chez une guêpe parasitoïde, Ampulex compress, qui pond dans le cerveau des blattes pour que ses larves s'y développent. En remplaçant le cerveau de la blatte par des cubes d'agarose de concentrations variées (donc plus ou moins denses), Gal et al. (2014) ont observé que la guêpe n'acceptait de pondre que dans un milieu dont la solidité se rapprochait d'un vrai cerveau de blatte et donc était capable d'apprécier avec son dard les informations mécano-sensorielles propres au milieu piqué. A l'aune de ces observations, on pourrait compléter le SI thermique par la présentation d’un matériau (cube d’agarose) dans lequel l'abeille piquerait, ce qui pourrait faire office de deuxième renforcement, jusque là absent de la procédure de conditionnement de la RED.

Dans le cadre de la seconde hypothèse, la RED peut être pensée comme une réponse défensive sélectionnée, qui s'exprime dans un contexte particulier et qui ne peut donc pas être apprise dans n'importe quelle situation. Certains auteurs défendent l’idée selon laquelle les capacités d'apprentissage des animaux en Laboratoire découlent des comportements qu’ils réalisent dans leurs niches écologiques et qui sont le fruit de la sélection naturelle. Ils considèrent ainsi les animaux comme "préprogrammés" à apprendre certaines associations, et d'une certaine manière (Bolles, 1970 ; Garcia et al., 1985; Gould, 2002). La nature défensive des comportements "agressifs" déclenchés par des stimulations nocives est remarquable par le fait que la majorité des animaux "attaqués" auront tendance à éviter la situation désagréable plutôt que d'attaquer la cible disponible (Potegal, 1979). Dans cette vision, ces comportements défensifs pourraient procéder d'un apprentissage opérant (Berkowitz, 1983). En d'autres termes, le comportement défensif verrait sa probabilité d'occurrence croître dès lors que sa manifestation fait cesser ou diminuer la stimulation aversive. Knutson et al. (1980) soutiennent cette idée en montrant que, lorsqu'un rat, stimulé par un choc électrique, voit ses attaques sur un individu conspécifique faire cesser la stimulation aversive, ses agressions tendent à augmenter. Le dard, en tant qu'appareil vulnérant, joue un rôle primordial dans les comportements défensifs de l'abeille (Free, 1961 ; Núñez et al., 1983 ; Breed et al., 2004). Ainsi concevoir l'apprentissage de la RED comme un conditionnement opérant déclenché par un signal (olfactif, visuel, tactile) pourrait permettre de résoudre les problèmes liés à la faible efficacité du protocole utilisé jusqu'alors, en positionnant la réponse au centre de la procédure. Dans ce cas, le SC serait présenté avant la stimulation thermique, mais cette dernière serait interrompue dès que la RED est déclenchée, afin que l'animal puisse associer son propre comportement (la RED) avec la cessation de la stimulation aversive. La principale difficulté de ce changement de paradigme réside dans l'arrêt à bon escient de la stimulation thermique car la RED peut être une réponse difficile à observer.

Par ailleurs, le contexte environnemental dans lequel l’abeille est susceptible d’exprimer un comportement de RED n’est pas à exclure des considérations. Dans de nombreuses études, les comportements « agressifs » (morsures, piqûres) des abeilles sont étudiés aux abords de la plateforme d’envol des colonies (Free, 1961 ; Millor et al., 1999 ; Giray et al., 2000 ; Hunt et al., 2007).

Lorsqu’un stimulus contrasté est présenté à l’entrée de la ruche, les ouvrières l’attaquent en le piquant, ce qui permet d’évaluer le comportement de défense de la colonie. De tels comportements agressifs sont rarement observés chez les butineuses dans les espaces ouverts éloignés de la colonie. Au contraire, ces ouvrières ont tendance à éviter les zones où un prédateur, comme une Thomise (araignée crabe, Misumena atia), a été rencontré auparavant (Dukas et Morse, 2003). Cette différence de comportement des ouvrières dans deux contextes différents pourrait avoir un lien avec le faible rendement obtenu dans le protocole de conditionnement aversif de la RED. Un stimulus contextuel tel qu’une odeur (une phéromone, par exemple) associant le lieu à la colonie (refuge), pourrait avoir été sélectionné comme un élément contextuel permettant de déclencher une réponse de défense optimale. Comme signal olfactif affectant l'apprentissage, la phéromone d’alarme a été observée comme diminuant les performances lors d'un conditionnement appétitif de la REP (Urlacher et al., 2010). Cependant, à notre connaissance, l’impact sur le conditionnement aversif n'a toujours pas été testé. L’ajout de cette odeur pendant (ou avant) un conditionnement aversif pourrait être nécessaire et permettrait d’optimiser les performances d'apprentissages des abeilles. Cette idée est soutenue par le fait que la phéromone d'alarme augmente les comportements défensifs exprimés par les ouvrières postées à l'entrée de la colonie (Boch, 1962). Dans une opposition entre modalités appétitive et aversive, cette phéromone pourrait faire l’objet d’un trade-off dont l'intensité (concentration) perçue serait le vecteur. Plus l'individu serait exposé à la phéromone d'alarme plus ses comportements appétitifs seraient inhibés et, à l’inverse, ses comportements aversif favorisés.

Bien que ces raisonnements puissent paraître exagérés sur certains points, nous pensons qu’ils ont pour avantage de changer le point de vue généralement pris pour aborder l'apprentissage aversif. De ce point de vue différent pourront peut-être apparaître des solutions pour améliorer notre protocole et pouvoir aborder une étude approfondie de la mémoire olfactive aversive.

b) Les mouvements antennaires comme reflets de l'apprentissage : une