• Aucun résultat trouvé

Les premières propositions d’implémentation d’une règle d’apprentissage STDP sur des dispositifs memristifs remontent à 2008 (Snider, 2008) et 2009 (Linares-Barranco and Serrano-Gotarredona, 2009). Celles-ci concernent des dispositifs memristifs bipo- laires dont les changements de conductance sont progressifs et cumulatifs, et qui peuvent donc être modélisés par la caractéristique de la figure 5.1. Cette caractéristique, ou une variante linéaire par morceau, est couramment utilisée pour les modèles de memristor dans les applications neuromorphiques. Elle ne modélise cependant de manière réa- liste que quelques dispositifs, de la famille des RRAM, en particulier le memristor de Hewlett-Packard (HP) Labs et la nano-synapse de l’Université du Michigan (ainsi que la PCM dans un cadrant uniquement, pour la cristallisation). Sur ces dispositifs, une faible tension ne modifie pas significativement la conductance et un seuil est généra- lement défini entre la caractéristique faible champ et celle à tension plus élevée. La règle STDP implémentée émule la forme asymétrique observée en biologie (Bi and Poo, 1998). Ces propositions ne présentent toutefois pas d’application concrète exploitant cette règle d’apprentissage.

Vth+ Vth- 0 ± V (V) dG dt (S/s) β+ α+ β- α- Slopes: |β+| >> |α+| |β-| >> |α-| ± V R = 1/G

Figure 5.1 – Caractéristique dynamique d’un dispositif memristif bipolaire progressif et cu- mulatif.

Dans (Snider, 2008), la dépendance temporelle de l’amplitude de la potentialisa- tion à long terme – «Long-Term Potentiation» (LTP) ou de la dépression à long terme – «Long-Term Depression» (LTD) avec l’intervalle entre l’impulsion post-synaptique et l’impulsion pré-synaptique est émulée par une série d’impulsions dont la durée di- minue dans le temps. Cela est illustré sur la figure 5.2(a). A gauche de la figure, un signal pré-synaptique génère une série d’impulsions dont l’amplitude est insuffisante pour modifier le poids de la synapse. Lorsque le neurone se déclenche plus tard dans le temps, l’impulsion post-synaptique s’additionne avec l’une des impulsions de la sé- rie pré-synaptique. La différence de potentiel résultante dépasse le seuil du dispositif memristif et a pour effet d’augmenter la conductance de la synapse. Si l’on suppose que cette modification est progressive, l’amplitude du changement de conductance sera d’autant plus faible que cette impulsion de programmation est courte, ce qui permet

(a)

(b)

Figure 5.2 – Propositions d’implémentation de STDP avec des dispositifs memristifs bipolaires. (a) (Snider,2008). (b) (Linares-Barranco and Serrano-Gotarredona,2009).

donc de moduler la LTP avec une série d’impulsions pré-synaptiques de plus en plus courtes. Le principe est identique pour la LTD (à droite de la figure), qui est implé- mentée avec une série d’impulsions post-synaptiques. Pour que les mécanismes de LTP et de LTD puissent avoir lieu simultanément, un mécanisme de multiplexage temporel «mélange» les signaux de communication, de LTP et de LTD. Dans ce système, une énergie conséquente peut être dépensée dans les très nombreuses charges et décharges des lignes du «crossbar».

Dans (Linares-Barranco and Serrano-Gotarredona, 2009), la modulation de l’am- plitude de la LTP/LTD est obtenue par une combinaison entre amplitude et durée des impulsions, comme cela est illustré sur la figure 5.2(b). L’amplitude du changement de conductance est supposée être proportionnelle à l’intégrale de la tension au-dessus du seuil du dispositif. Il est ainsi possible d’obtenir différentes formes de caractéristiques STDP asymétriques en fonction de la forme des impulsions pré- et post-synaptiques. Dans cette proposition d’implémentation, la largeur des impulsions doit être égale aux fenêtres temporelles de la LTP/LTD, qui sont typiquement de l’ordre de 10 à 100 ms pour les applications présentées dans le chapitre précédent. Cela implique que la dynamique du dispositif corresponde à la dynamique de STDP, c’est-à-dire que des im- pulsions de plusieurs millisecondes ne doivent que modifier légèrement sa conductance. Si le dispositif peut être lu et programmé en quelques microsecondes, cette solution multiplie par mille la consommation énergétique par rapport à un protocole optimal.

pour mettre au point des applications intéressantes. Au contraire, une forme simplifiée de STDP, avec seulement un niveau de LTP et un niveau de LTD, nous a permis de montrer des applications nouvelles à l’état de l’art. Cette règle STDP est nettement plus simple à implémenter, puisqu’elle n’implique pas de dépendance temporelle entre l’amplitude de la LTP/LTD et les instants pré-post synaptiques. La figure 5.3 présente une implémentation de cette règle avec des dispositifs memristifs bipolaires modélisables par la caractéristique de la figure 5.1.

Vth+

Vth-

PRE pulse POST pulse POST without PRE POST with PRE LTP

VPRE

VP-

VP+

0

Input No input Input No input

VPRE VP+

POST spike

VP-

G  G  G  G 

LTD

Figure 5.3 – Notre proposition d’implémentation de la STDP simplifiée avec des dispositifs memristifs bipolaires.

Le système fonctionne comme suit. Lorsqu’un neurone d’entrée est activé, celui- ci propage une impulsion d’amplitude et de durée minimales vers ses synapses pour permettre l’intégration de leur conductance (poids synaptique) par les neurones de sortie. Le neurone d’entrée passe alors dans un état dit «LTP» pour la durée de la fenêtre de LTP de la règle STDP (implémenté par une machine d’état par exemple). Lorsqu’un neurone de sortie se déclenche, il envoie un signal «POST spike» à l’ensemble de ses neurones d’entrée pour leur signaler une opération de mise à jour des poids synaptiques. Les neurones d’entrée qui sont alors dans un état «LTP» émettent une impulsion de programmation VPRE, qui interagit avec l’impulsion de programmation VP+/VP- émise par le neurone de sortie et induit une LTP sur leur synapse. En cas d’absence d’impulsion VPRE, les synapses subissent une LTD, avec les impulsions telles que représentées en bas de la figure 5.3.

Il est en outre possible de calculer les valeurs optimales des tensions VPRE, VP+ et VP- par rapport aux tensions de seuil des dispositifs memristifs Vth+ et Vth- pour autoriser une variabilité maximale sur les seuils (flèches grisées sur l’axe) :

VPRE= 2/3.Vth+ (5.1a)

VP- = −2/3.Vth+ (5.1b)

5.3

Démonstration d’une mémoire associative sur NOM-

Documents relatifs