• Aucun résultat trouvé

5.3 Modulation de l’activité dans la règle BCM

6.1.1 Étage sensoriel

Rôle et propriétés

L’ensemble des activités sensorielles de la carte a pour but de représenter les informations contenues dans le stimulus courant du flux montant de manière distribuée. Nous utilisons pour cela un codage tabu-laire, ce qui signifie que l’activité sensorielle de chaque colonne est d’autant plus forte que l’information contenue dans le stimulus courant est similaire à une information dite discriminée. Combiné à

l’auto-6.1. Modèle 107 stimulus courant étage sensoriel flux latéral flux montant connexion excitatrice étage perceptif modulation de l'apprentissage (poids ) (poids ) (activité ) (activité ) carte modale colonne

ligne

colonne

Figure6.1 – Utilisée de manière isolée, la carte modale est dépourvue d’étage cortical, étage qui sert à la mise en relation multimodale. Cette carte auto-organisatrice est constituée d’un ensemble de colonnes corticales organisées suivant une grille bidimensionnelle. Chaque colonne corticale reçoit un flux montant par des connexions reliées à son étage sensoriel. L’activité sensorielle est le terme afférent de l’étage perceptif. Ce dernier est également relié aux étages perceptifs de toutes les autres colonnes de la carte modale, définissant un flux latéral. L’activité perceptive est calculée suivant le paradigme de la CNFT. Cette activité module l’apprentissage des poids montants de la colonne, modifiés par la règle de plasticité synaptique BCM.

organisation de ces discriminations au niveau de la carte, ce codage fournit une activité spatialement cohérente à des stimuli inconnus (voir le chapitre 4).

Contrairement aux modèles de Ménard [Ménard and Frezza-Buet, 2005] et Alecu [Alecu et al., 2011], qui utilisent des neurones à prototypes, l’obtention du codage tabulaire des étages sensoriels est obtenu, dans notre modèle, grâce à la règle de plasticité synaptique BCM, qui permet l’apprentissage non super-visé et continu d’une discrimination à une corrélation présente dans le flux montant (voir le chapitre 5). L’utilisation de cette règle d’apprentissage offre de nombreux avantages théoriques et pratiques vis-à-vis de notre problématique.

mon-tant. Ceci permet le traitement multimodal de l’information dans SOMMA puisqu’il s’appuie sur la détection de corrélation multimodales, pour les raisons évoquées dans le chapitre 3, corrélations multi-modales qui correspondent à un ensemble de corrélations monomulti-modales (voir la partie III).

Deuxièmement, l’activité sensorielle d’une colonne dépend de la présence de la corrélation discriminée dans le stimulus courant. Ainsi, en cas d’absence de stimulation (stimulus nul), l’activité sensorielle de l’ensemble des colonnes de la carte est nulle, ce qui peut ne pas être le cas avec des neurones à prototypes. Au sein de chaque colonne, l’activité sensorielle excite l’étage perceptif (voir la section 6.1.2), l’activité perceptive dans la carte est par conséquent également nulle. Comme l’activité perceptive est utilisée pour la mise en relation multimodale (voir le chapitre 7), cette modalité n’entre pas en compte dans la per-ception multimodale, ce qui est cohérent avec l’absence de stimulation reçue dans cette modalité. Troisièmement, le codage tabulaire est obtenu par une somme pondérée de l’activité entrante. Contrai-rement aux neurones à prototypes, il ne nécessite donc pas de faire l’hypothèse de l’existence et de la connaissance d’une distance définie entre les stimuli, hypothèse qui nous paraît difficilement vérifiable pour un flux de données quelconques.

Quatrièmement, la capacité de la règle BCM à faire émerger une discrimination de manière autonome offre une solution technique pour l’utilisation du paradigme de la CNFT pour l’étage perceptif (voir le chapitre 5).

Cinquièmement, la règle BCM est une règle d’apprentissage continu. Ainsi, en cas de modification du flux d’entrée, elle développe automatiquement une nouvelle discrimination si sa corrélation discriminée disparaît de l’environnement, offrant ainsi une adaptabilité du modèle aux environnements changeants. Équations

Chaque colonne d’une carte modale reçoit un flux montant constitué d’une succession de stimuli correspondant chacun à un vecteur de taille fixe l contenant des réels. Ce flux montant peut, par exemple, correspondre aux données envoyées par un capteur robotique quelconque, comme une caméra. L’activité sensorielle d’une colonne corticale située à la ième ligne et la jèmecolonne d’une carte modale m, notée cm

i,j, au temps t, est calculée comme la somme pondérée du stimulus courant du flux montant :

us(cm i,j, t) = l X k=1 wkFF(cm i,j, t)xm k(t) avec wFF (cm i,j, t) = (wFF 1 (cm i,j, t), ..., wFF l (cm

i,j, t)) le vecteur de poids des connexions montantes et xm(t) = (xm

1 (t), ..., xm

l (t)) le stimulus courant.

Le vecteur de poids wFF évolue suivant la règle de plasticité synaptique BCM avec modulation additive (voir chapitre 5). Le mécanisme de modulation permet d’influencer la discrimination émergente afin d’obtenir une réponse sensorielle à des stimuli modulés. Dans notre cas, c’est l’activité perceptive qui joue ce rôle de signal modulateur. Ainsi, au niveau de la carte, la cohérence spatiale de l’activité perceptive est propagée à l’organisation des discriminations de l’étage sensoriel (voir les sections 5.3.3 et 6.1.2). Comme l’activité sensorielle sert de terme afférent au calcul de l’activité perceptive, sa modulation n’intervient que pour la modification des poids afférents, afin d’éviter une boucle auto-excitatrice. Les équations de la règle BCM, appliquées à notre cas, sont les suivantes pour une colonne corticale située à la ièmeligne et la jèmecolonne d’une carte modale m au temps t :

us+(cm

i,j, t) = us(cm

i,j, t) + λup(cm

i,j, t) activité modulée θ(cm

i,j, t) = 1 τ

Z t −∞

us+(cmi,j, t)2et−t′τ dt seuil flottant LTP/LTD ∀k, dw FF k (cm i,j, t) dt = ηxm k (t)us+(cm i,j, t)(us+(cm i,j, t) − θ(cm

i,j, t)) modification des poids

avec λ la force de la modulation, τ l’horizon temporel du filtre exponentiel et η le taux d’apprentissage. L’utilisation pratique de ces équations nécessite deux modifications.

Premièrement, le seuil LTP/LTD θ(cm

6.1. Modèle 109 la conservation en mémoire de l’ensemble des activités passées, ce qui est impossible des points de vues informatique et biologique. Cependant, ce calcul peut s’exprimer sous la forme d’une équation différentielle se calculant de manière itérative, ce qui permet de ne pas avoir à garder l’historique des activités :

dθ(cm i,j, t) dt = 1 τ(us+(cm i,j, t)2− θ(cm i,j, t))

Deuxièmement, afin de calculer les équations différentielles utilisées pour l’évolution des poids montants, nous utilisons la méthode d’Euler avec un pas de discrétisation du temps δt fixe. Cette méthode est généralement choisie pour la mise en pratique de la règle BCM et consiste à utiliser l’approximation suivante : df(t)

dt = f(t + δt) − f(t)

δt pour une fonction f dérivable. Au final, pour l’étage sensoriel, les équations utilisées sont les suivantes :

us(cm i,j, t) = l X k=1 wFF k (cm i,j, t)xm k(t) activité us+(cm i,j, t) = us(cm i,j, t) + λup(cm

i,j, t) activité modulée θ(cm

i,j, t+ δt) = 1 τu

s+(cmi,j, t)2+ (1 − 1τ)θ(cmi,j, t) seuil flottant LTP/LTD ∀k, wFF k (cm i,j, t+ δt) = wFF k (cm i,j, t) + ηxm k(t)us+(cm i,j, t)(us+(cm i,j, t) − θ(cm

i,j, t)) modification des poids avec λ la force de la modulation, τ la fenêtre d’intégration temporelle du seuil flottant LTP/LTD et η le taux d’apprentissage des poids montants (qui inclut le δt). L’utilisation pratique de ces équations nécessite le réglage de ces différents paramètres. Afin que le modèle soit facilement utilisable, il nous parait important de détailler le rôle de chaque paramètre ainsi qu’un moyen théorique ou empirique de régler chacun d’eux, ce que nous décrivons dans la section suivante. Nous tenons à souligner ici que l’ensemble de ces paramètres est identique pour chacune des colonnes, ces dernières étant génériques.

Paramètres

Blais a étudié l’influence des paramètres η et τ de la règle BCM sur sa convergence dans le cas d’une entrée monodimensionnelle constante x(t) = (d) pour toute valeur de t (voir [Blais et al., 1998]). Intuitivement, si la fenêtre d’intégration τ est trop grande par rapport au taux d’apprentissage η, la dynamique du seuil LTP/LTD sera trop lente par rapport à la modification du poids et ce dernier atteindra le point fixe avant le seuil et donc le dépassera. Une fois que la valeur du seuil aura dépassé celle de l’activité, les poids synaptiques décroîtront et atteindront à nouveau le point fixe avant le seuil, engendrant par là-même des oscillations. Partant de cette constatation, Blais a modélisé la variation des poids par un mécanisme oscillatoire et en a tiré les conclusions suivantes :

– si τ ηd2≤ 3 −8 ≈ 0.17 alors le poids converge sans oscillations, – si τ ηd2∈]3 −8; 1] alors le poids converge en oscillations atténuées, – si τ ηd2>1 le poids ne se stabilise pas.

Ces trois comportements sont représentés figure 6.2. Cette caractérisation des dynamiques permet de faciliter le paramétrage de η connaissant τ dans le cas monodimensionnel mais donne également une bonne base de départ pour un environnement constitué de plusieurs stimuli. Dans ce dernier cas, il faut également tenir compte du fait que l’activité varie suivant les stimuli reçus, avec un écart grandissant. En effet, une fois la discrimination atteinte, l’activité sera nulle pour tous les stimuli et vaudra 1

p pour le stimulus discriminé, avec p la probabilité d’apparition de ce dernier dans le flux d’entrée, perçue par le filtre exponentiel utilisé pour le calcul du seuil (voir figure 5.5). Ces fortes disparités entre les réponses engendrent des fluctuations du seuil qui gênent la stabilisation du point fixe, ce qui impose donc un abaissement du taux d’apprentissage en comparaison de ceux trouvés par Blais dans le cas monodimensionnel.

Le calcul de l’activité perceptive utilise le paradigme de la CNFT (voir la section 6.1.2). Il en résulte que la stabilisation de la bulle d’activité émergente dans l’étage perceptif, par convergence de l’équation

Figure 6.2 – La règle BCM est utilisée avec une entrée monodimensionnelle constante unitaire ce qui se traduit par x(t) = (d) = (1). Suivant la valeur du terme τ ηd2, la dynamique d’évolution de l’activité est différente. À gauche, τ ηd2

≤ 3 −8 ce qui garantit une convergence sans oscillations. Au milieu, τ ηd2∈]3 −8; 1] et la convergence est encore atteinte mais par oscillations atténuées. À droite, τ ηd2>1 ce qui conduit à une non stabilisation de l’activité.

différentielle de la CNFT, nécessite la stabilité du terme afférent, et donc du stimulus courant du flux monomodal, pendant un certain temps. Cela doit être pris en compte dans le réglage de la règle BCM.

En pratique, nous cherchons à réduire au maximum les temps de simulations. Plus la fenêtre temporelle τ utilisée est grande, plus le taux d’apprentissage η doit être petit. τ doit donc être choisi le plus petit possible, tout en permettant une bonne évaluation de la distribution des stimuli dans le flux d’entrée, malgré la stabilité temporelle des stimuli, pour permettre le bon fonctionnement de la règle BCM. Une fois τ fixé, nous utilisons le taux d’apprentissage le plus grand possible compatible avec ce τ , dont une idée de la valeur maximale est donnée par l’étude de Blais. η doit également être choisi de manière à ce que la dynamique d’évolution de l’activité perceptive soit plus rapide que celle utilisée pour l’apprentissage des poids montants.

Par ailleurs, concernant le réglage du mécanisme de modulation de la règle BCM, plus la force de mo-dulation λ est forte, plus la momo-dulation est efficace et donc plus l’auto-organisation des discriminations est spatialement cohérente. Cependant, nous avons vu dans le chapitre 5 que pour assurer le fonctionnement du mécanisme de modulation, λ doit être inférieur à 1

p∗M∗ avec p la probabilité maximale d’apparition d’une corrélation dans le flot montant et Mla valeur maximale du terme de modulation, qui correspond ici à l’activité perceptive. Afin d’obtenir une auto-organisation sans trop de ruptures de continuité, λ doit être pris proche de cette borne. En pratique, l’activité perceptive est bornée (voir la section 6.1.2), ce qui fournit la valeur maximale M. Si l’on veut que le paramétrage soit valable pour n’importe quel type de flux d’entrée, on a p= 1. En pratique, si l’on dispose d’un a priori sur la distribution des corrélations dans l’espace d’entrée, on peut ajuster plus finement cette valeur afin d’augmenter la valeur de λ.