• Aucun résultat trouvé

Latences et sélectivité

Dans le document en fr (Page 154-157)

Apprentissage temporel au sein d’une population

2.4. Latences et sélectivité

Cette dynamique est confirmée par l’évolution des latences postsynaptiques au cours de l’apprentissage (Figure III.12). En effet, les premières réponses apparaissent en moyenne vers 35 millisecondes. Elles chutent ensuite assez vite, en moins de 10.000 stimulations, et atteignent un premier niveau relativement stable, aux alentours de 25 millisecondes. Remarquablement, cela correspond à l’étape de catégorisation grossière décrite ci-dessus: des réponses rapides sont obtenues très vite qui permettent de coder l’ensemble de l’espace d’entrée.

Figure III.12. Evolution des latences postsynaptiques. Latence postsynaptique en fonction du nombre de présentations (abscisse en échelle logarithmique jusqu’à 100.000, linéaire ensuite). Les latences ont été moyennées par une fenêtre glissante de largeur 1.000 centrée sur la présentation courante. L’évolution des temps de réponses suit la dynamique d’apprentissage: initialement évoquées autour de 35 millisecondes, elles diminuent d’à peu prés 10 millisecondes pour atteindre un plateau correspondant à la catégorisation grossière des orientations de visage. Quand elles arrivent en phase de spécialisation (l’apparition des groupes B à D), les latences vont connaître une seconde diminution, de 2 millisecondes environ, pour atteindre un état stable.

Puis les latences moyennes subissent une nouvelle réduction, moins forte, qui les conduisent à peu prés à 23 millisecondes. À ce moment aussi, cette accélération des réponses coïncide peu ou prou avec une phase de l’apprentissage, celle de spécialisation des réponses. La nouvelle

diminution apparaît en effet peu après l’apparition du second groupe d’unités, accompagnant la mise en place des cellules des groupes B-D: des réponses encore plus rapides pour une plus grande sélectivité des neurones. Enfin, au moment où la convergence est atteinte, les latences moyennes sont devenues stables et le resteront encore après, comme l’avait déjà suggéré la carte de réponses (Figure III.11 étape 320.000 et au-delà jusqu'à 460.000).

Comme dans le cas de 1 neurone et 1 stimulus (Chapitre II), l’apprentissage par STDP se manifeste par une réduction de la latence postsynaptique, jusqu’à atteindre un niveau où les réponses sont devenues sélectives et stables. Cependant, par rapport à ce même cas, la réduction de latence est ici sensiblement inférieure : de ~120 ms a ~25 ms comparé ici à une chute de ~35 à ~23ms. En fait cette différence est due à la quantité de synapses ainsi que le seuil de chaque neurone : à poids initiaux égaux, et dans des conditions comparables de répartition temporelle des décharges présynaptiques, un neurone avec 1000 synapses et un seuil de 100 (cas du Chapitre II) va atteindre son seuil moins rapidement qu’un neurone avec 7200 synapses et un seuil de 36 comme c’est le cas ici. Ces modifications remettent-elles en question la continuité des deux expériences ? Nous remarquerons d’abord que la simulation du Chapitre II aurait pu être menée avec un seuil de 36 et 7200 synapses: les premières réponses seraient alors apparues avant 120 ms, mais le résultat serait resté le même : les entrées auraient été trouvées par STDP et potentialisées sélectivement. Ensuite, comme nous le verrons par la suite, le seuil en lui-même ne change pas dramatiquement les résultats rapportés ici. Modifier le nombre de synapses pourrait-il empêcher la STDP de trouver celles correspondant aux premières décharges ? Si toutes les synapses reçoivent une activité temporellement structurée, alors leur caractère d’entrée précoce ou tardive sera déterminé par leur rang dans la séquence d’activation, quel que soit leur nombre. La réponse est donc négative. Notons aussi que le nombre de synapses utilisé ici est plus biologiquement réaliste, puisqu’un neurone dispose typiquement d’une dizaine de milliers de synapses. Enfin, ce ne sont pas tant les réponses initiales qui nous intéressent mais bien les latences des réponses finales, et stables, produites par le processus d’apprentissage.

Revenons donc sur l’évolution des latences postsynaptiques en fonction du nombre de présentations. Comme pour la dynamique temporelle des formations de sélectivités, l’évolution des latences postsynaptiques moyennes suit deux phases : une catégorisation grossière puis une spécialisation des réponses. Donc latences et sélectivité des réponses sont concomitantes, comme

il est suggéré dans le Chapitre II. Mais contrairement à ce cas simple, nous pouvons ici aborder cette question de la transformation intensité–délai plus directement. Plus une stimulation est proche du stimulus préféré d’un neurone, plus la latence de décharge est courte (Gautrais & Thorpe, 1998; Thorpe, Delorme & VanRullen, 2001). Par exemple, certains neurones de V1 présentent une sélectivité à l’orientation dans leur latence de décharge : plus l’orientation du stimulus diffère de l’orientation préférée du neurone, plus sa latence est courte (Celebrini, Thorpe, Trotter & Imbert, 1993). Ici, les 9 neurones sélectionnés ont finalement appris des réponses sélectives, du point de vue de la population : un neurone précis répond pour une identité et une orientation données, et ce manière systématique.

Figure III.13. Sélectivité à l’orientation des neurones. Pour chaque neurone, la latence postsynaptique moyenne est montrée en fonction de l’orientation du visage (trait noir; déviation standard autour de la moyenne en grisé). Elle est calculée sur 10 présentations de la base entière au système dans son état final. En dessous de 10 réponses sur les 280 possibles (28 visages présentés 10 fois) la latence n’est pas prise en compte. Autour de l’orientation de visage préférée d’un neurone (en pointillés), les latences diminuent progressivement jusqu’à atteindre les limites de la bande d’orientation.

Mais présenteraient-ils une sélectivité individuelle, comparable à celle des neurones de V1 cités en exemple ? Autrement dit, la latence postsynaptique du neurone varie-t-elle systématiquement avec, par exemple, l’orientation du stimulus ? Pour adresser cette question, le système a été pris dans son état final (i.e. celui qu’il avait atteint lors de la convergence) et la base d’images lui a été présentée une dizaine de fois. Puis la latence moyenne de réponses aux orientations, à travers les visages, a été calculée pour chaque neurone. Et de fait, les latences moyennes ont tendance à augmenter progressivement au fur et à mesure que l’orientation du visage s’éloigne d’une orientation à la latence moyenne minimale, correspondant d’ailleurs à l’orientation du visage visible dans le champ récepteur (Figure III.13, notamment le neurone numéro 5).

Au final, l’apprentissage temporel au sein d’une population se caractérise effectivement par la sélection d’un sous-ensemble de neurones, qui vont développer des représentations structurées leur permettant des réponses sélectives tant du point de vue de la population qu’au niveau individuel. Maintenant ce résultat est-il robuste ? S’il a été reproduit systématiquement dans les mêmes conditions, l’influence de certains paramètres pourrait le modifier, ou affiner un peu plus notre compréhension du phénomène. Nous allons donc analyser ci-dessous deux paramètres qui s’avèrent critiques : le seuil du neurone, auquel nous avons souvent fait allusion jusqu’ici ; puis celui de la taille initiale de la population.

Figure III.14. Influence du seuil de décharge sur la répartition des réponses. Les simulations ont été refaites en modifiant les seuils de décharge (à gauche 20 ; à droite 50). Dans les deux cas, les cartes de réponses ont été reconstruites à l’étape de première catégorisation grossière, définie comme la première où toutes les entrées sont reconnues par un neurone finalement sélectionné (4.000 – en haut), ainsi qu’au stade final (en bas – de gauche à droite, après 257.964 et 130.711 stimulations). Dans les deux cas, le système a sélectionné, au stade de catégorisation grossière, plus de neurones que dans le cas de base (soit respectivement 7 et 5 contre 3). Pour un seuil plus bas, 11 neurones sont impliqués qui produisent une carte de réponses très fragmentée. Pour un seuil plus haut, 6 neurones suffisent pour coder l’espace d’entrée. Les domaines de réponses y sont plus larges, et ont même perdu beaucoup de leur sélectivité à la taille du visage.

3. Influence de quelques paramètres sur la dynamique

Dans le document en fr (Page 154-157)