• Aucun résultat trouvé

Utilisation de la règle BCM modulée comme étage de sélection

5.3 Modulation de l’activité dans la règle BCM

5.3.3 Utilisation de la règle BCM modulée comme étage de sélection

Nous souhaitons utiliser la règle de plasticité BCM avec modulation pour l’ étage de détection d’une carte auto-organisatrice. Le signal modulateur de la règle BCM correspond alors à l’activité de l’étage de sélection. Dans ce cadre, la modulation de la règle BCM doit être la plus efficace possible peu importe l’activité initiale du neurone afin d’influer au mieux l’organisation des discriminations au niveau de la carte. En particulier, il est important que la modulation soit efficace quelle que soit la réponse neuronale à un stimulus. Pour cette raison, notre choix se porte sur le mécanisme de modulation additive.

Organisation des discriminations

Nous avons vu que, par un mécanisme d’extrapolation des discriminations, les cartes auto-organisatrices permettaient la représentation de stimuli inconnus, ce qui est une des propriétés attendues pour nos cartes modales. Dans le cas de l’utilisation d’un codage à prototypes pour l’étage de détection, cette extrapola-tion est rendue possible par le fait que si deux stimuli quelconques sont modulés, l’unité devient sensible à un stimulus situé entre les deux par rapport à la distance définie a priori entre les stimuli (voir le

(a) sans modulation

(b) modulation additive

Figure 5.11 – Représentation de la modification moyenne, résultant de la règle BCM, du vecteur des réponses d’un neurone à deux stimuli orthonormés x1= (1, 0) et x2= (0, 1) et équiprobables (p1= p2= 0.5), en fonction des réponses aux deux stimuli. La direction de la modification est représentée par les flèches et sa norme en niveau de gris (échelle à droite). En (a) sont représentés les bassins lorsqu’aucun stimulus n’est modulé et en (b) lorsque le stimulus x1reçoit une modulation additive unitaire. Comme la modification des poids se calcule à partir de l’activité neuronale modulée, la modulation additive se traduit par une translation de la représentation le long de l’axe des abscisses de vecteur (−1, 0) correspondant à l’opposé de la modulation. Ainsi, un neurone avec une certaine initialisation de ses poids afférents (croix noire sur le schéma) pourra changer de bassin d’attraction par l’influence de la modulation et tendre ainsi à discriminer le stimulus modulé.

5.3. Modulation de l’activité dans la règle BCM 99

(a) sans modulation

(b) modulation multiplicative

Figure 5.12 – Représentation de la modification moyenne, résultant de la règle BCM, du vecteur des réponses d’un neurone à deux stimuli orthonormés x1 = (1, 0) et x2 = (0, 1) et équiprobables (p1 = p2= 0.5), en fonction des réponses aux deux stimuli. La représentation utilisée est la même que celle de la figure 5.11. En (a) sont représentés les bassins lorsqu’aucun stimulus n’est modulé et en (b) lorsque le stimulus x1 reçoit une modulation multiplicative de valeur 2. Comme la modification des poids se calcule avec l’activité neuronale modulée, la modulation multiplicative se traduit par une homothétie de la représentation le long de l’axe des abscisses par rapport à l’origine et de rapport 2 correspondant à la valeur de la modulation. Ainsi, avec la même initialisation des poids d’un neurone (croix noire sur le schéma), grâce à la modulation, le neurone tendra à discriminer le premier stimulus, qui est modulé. Cependant, de manière générale, la modulation multiplicative n’est que peu efficace si la réponse neuronale non modulée au premier stimulus est proche de 0 (croix bleue) voire a l’effet inverse si cette activité est négative (croix verte).

chapitre 4). La règle BCM ne peut disposer d’une telle caractéristique car elle n’utilise pas de distance explicite sur l’espace d’entrée. Elle présente cependant un comportement similaire dans certains cas.

Notons Ec(s1, s2) l’ensemble des neurones présynaptiques ayant un fort niveau d’activité pour les stimuli s1et s2. s1et s2 sont dit proches si Ec(s1, s2) 6= ∅ et éloignés dans le cas contraire. Si l’ensemble des stimuli modulés reçus par un neurone sont éloignés deux à deux, la règle BCM fait apparaître une sélectivité à l’un des deux stimuli (voir la figure 5.13). Cependant, si deux stimuli modulés sont proches alors la règle BCM peut faire apparaître une sélectivité à n’importe quel stimulus qui est proche des deux stimuli modulés (voir la figure 5.14). Cela s’explique par le fait que la modulation d’un stimulus, tend à fournir une LTP, ce qui se traduit par l’augmentation des poids des connexions correspondant aux neurones pré synaptiques activés dans ce stimulus. En particulier, si deux stimuli proches s1 et s2 sont modulés, les poids des connexions correspondant aux neurones pré synaptiques appartenant à Ec(s1, s2) sont susceptibles d’augmenter plus rapidement que les poids correspondant aux neurones pré synaptiques qui ne sont activés que dans l’un des deux stimuli. Cela a pour conséquence d’accroître la réponse du neurone à n’importe quel stimulus dont certains des neurones pré synaptiques activés appartiennent à Ec(s1, s2), ce qui favorise ces stimuli dans la compétition temporelle engendrée par la règle BCM. Cette dernière peut donc faire émerger une discrimination à l’un de ces stimuli, stimulus qui est proche de s1

et s2 par définition.

Grâce à cette propriété d’extrapolation locale de la règle BCM modulée, la cohérence spatiale de l’activité de l’étage de sélection permet d’obtenir l’auto-organisation des discriminations émergeant de la règle BCM par une dynamique similaire à celle des cartes de Kohonen. De plus, comme la règle BCM ne peut extrapoler des discriminations qu’à des stimuli proches de ceux déjà discriminés, cela permet de s’affranchir du problème d’unités mortes présenté par les cartes de Kohonen (voir le chapitre 4). En effet, la règle BCM ne peut faire apparaître de discrimination à un stimulus inconnu qui activerait des neurones pré synaptiques qui ne sont activés par aucun autre stimulus. Ces propriétés sont illustrées plus en détail dans le chapitre 6.

Il est à noter que, en contrepartie, cette propriété d’extrapolation restreinte à des stimuli proches peut amener à certaines ruptures de continuités dans l’auto-organisation. En effet, de par la cohérence spatiale de l’activité de sélection, une unité a son étage de sélection activé en cas de réception d’un stimulus discriminé par ses unités voisines. Si ces dernières discriminent des stimuli lointains, alors l’unité développera une sélectivité à l’un de ces stimuli, créant une rupture dans l’auto-organisation (voir le chapitre 6 pour des exemples).

Couplage avec la CNFT

L’utilisation de la règle BCM modulée pour l’étage de détection permet de s’affranchir du problème des bulles fixes causé par l’utilisation des champs neuronaux comme étage de sélection. En effet, en cas de bulle fixe, pour les unités sous la bulle, le signal de modulation reçu par la règle BCM sera identique pour tous les stimuli. Cependant, la règle BCM, par ses propriétés, développera une discrimination, ce qui fournira une réponse nulle à certains stimuli. Grâce au terme de fuite de la CNFT, la bulle sera alors forcée de changer de localisation (voir chapitre 4).

De plus, la stabilisation d’une bulle d’activité dans l’étage de sélection prend un certain temps (voir chapitre 4) durant lequel le signal de modulation reçu par l’étage de détection pourra être erroné. La propriété de stabilité de la discrimination de la règle BCM permet de limiter la variabilité de la discrimi-nation à ces erreurs.

Pour ces raisons, le choix de la règle BCM pour l’étage de détection d’une carte auto-organisatrice permet l’utilisation des champs neuronaux comme étage de sélection (voir chapitre 6 pour plus de détails).

5.4 Conclusion

La règle de plasticité synaptique BCM est une règle mésoscopique de type hebbienne fournissant un apprentissage continu et non supervisé. Dans le cas d’un flux d’entrée composé de stimuli linéairement indépendants, possiblement bruités, il a été mathématiquement démontré que les points stables de cette règle correspondent à la discrimination de l’un des stimuli. Cette discrimination émerge grâce au

mé-5.4. Conclusion 101

(a)

(c)

(b)

0.0

1.0

Figure5.13 – Nous avons testé le comportement d’un neurone utilisant la règle BCM avec modulation additive et recevant en entrée des stimuli de taille 100 contenant chacun une gaussienne dont la localisation est choisie de manière aléatoire à une valeur discrète. Seuls les deux stimuli contenant une gaussienne localisée en 30 ou en 60, respectivement montrés en (b) et (c), sont modulés durant l’apprentissage. Ces deux stimuli sont éloignés car ils n’activent aucun neurone pré synaptique en commun. Nous avons représenté en (a) des exemples de profils de réponse de neurone, après apprentissage, en fonction de la localisation x de la gaussienne contenue dans le stimulus. Chaque ligne représente le profil obtenu lors de l’un de nos cent tests. Nous pouvons observer que sur chacun des cent essais, la règle BCM a discriminé l’un des deux stimuli modulés.

canisme de compétition temporelle entre les stimuli engendré par la variabilité du seuil LTP/LTD. En pratique, avec un flux d’entrée contenant un ensemble de stimuli non linéairement indépendants, la règle BCM fait émerger un codage tabulaire fondé sur la détection d’une corrélation. Avec ce codage, le neurone

(a)

(c)

(b)

0.0

1.0

Figure5.14 – Par rapport à la figure 5.13, le protocole est le même à ceci près que les deux seuls stimuli modulés sont ceux contenant une gaussienne localisée en 40 ou en 50, stimuli qui sont respectivement représentés en (b) et (c). Ces deux stimuli sont proches car certains neurones pré synaptiques sont activés dans les deux stimuli. En (a) sont représentés des exemples de profil de réponse du neurone, après apprentissage, en fonction de la localisation x de la gaussienne contenue dans le stimulus. Chacun ligne représente le profil obtenu lors de l’un de nos cent tests. Dans ce cas, la règle BCM peut devenir sélective à n’importe quel stimulus proche des deux stimuli modulés c’est-à-dire, ici, un stimulus qui contient une gaussienne localisée entre 40 et 50.

répond fortement si le stimulus courant contient la corrélation discriminée et plus faiblement si il contient une corrélation proche de celle discriminée.

L’utilisation de la règle BCM pour l’étage de détection d’une carte auto-organisatrice nécessite de pouvoir influencer l’émergence des discriminations afin de les organiser au niveau de la carte. Cette

5.4. Conclusion 103 possibilité est fournie par la modulation additive de l’activité par un signal correspondant à l’activité de l’étage de sélection. La modification de la réponse neuronale à un stimulus permet de biaiser la compétition temporelle entre les stimuli afin de favoriser l’émergence d’une sélectivité à un stimulus modulé. Ce mécanisme de modulation permet également une extrapolation de la discrimination à des stimuli proches de ceux modulés. Ainsi, la cohérence spatiale de la bulle d’activité de l’étage de sélection peut être propagée à l’organisation des discriminations émergeant de la règle BCM. L’utilisation de la règle BCM pour l’étage de détection apporte une solution technique à la problématique de l’utilisation d’un étage de sélection utilisant le paradigme de la CNFT. Ce couplage est rendu possible, d’une part, car le mécanisme de modulation de la règle BCM ne dirige pas l’apprentissage mais ne fait que l’influencer. Ainsi, même en cas de bulle fixe, la règle BCM développe une sélectivité à un stimulus, ce qui amènera la bulle à changer de localisation. D’autre part, ce couplage est également facilité par la stabilité de la discrimination de la règle BCM qui est alors moins sensible à l’incohérence du signal de modulation pendant la stabilisation de l’activité de la CNFT.

La règle BCM fournit un traitement actif de l’information qui est intéressant vis-à-vis de notre pro-blématique.

Premièrement, contrairement aux neurones à prototypes, le codage tabulaire émerge de l’apprentissage de la règle BCM et ne nécessite donc pas l’utilisation d’une distance a priori entre les stimuli.

Deuxièmement, ce codage tabulaire porte sur une corrélation présente dans le flux d’entrée, ce qui est la seule propriété attendue pour les cartes modales de notre modèle SOMMA non offerte par le paradigme des cartes auto-organisatrices. Le neurone répond ainsi de manière identique si la corrélation discriminée se trouve dans le stimulus, quel que soit le contexte dans lequel elle est présente, c’est-à-dire les autres valeurs du stimulus ne correspondant pas à cette corrélation.

Troisièmement, deux vecteurs d’entrées pré synaptiques colinéaires peuvent être interprétés comme deux stimuli identiques dont l’intensité est différente. Comme l’activité neuronale est calculée comme la somme pondérée des activités pré synaptiques, la règle BCM permet non seulement de discriminer la présence d’une corrélation mais également de transmettre l’intensité de cette corrélation.

Quatrièmement, la règle BCM s’adapte à des changements environnementaux. En effet, si la corrélation discriminée disparaît de l’environnement, le neurone développe alors une nouvelle discrimination car il s’agit des seuls points stables de la règle BCM. La règle BCM offre ainsi un compromis intéressant dans le dilemme plasticité/stabilité.

Dans le prochain chapitre, nous décrivons notre modèle de carte modale du modèle SOMMA qui utilise ce couplage BCM/CNFT permettant l’apprentissage et la généralisation des corrélations présentent dans le flux d’entrée. Nous présentons également plusieurs exemples d’utilisations qui illustrent les différentes propriétés évoquées dans ce chapitre et dans le chapitre 4.

Chapitre 6

Le modèle SOMMA dans un cadre

monomodal

Nous nous intéressons dans ce chapitre à l’étude d’une carte modale du modèle SOMMA (voir le chapitre 3) utilisée de manière isolée, ce qui signifie sans l’étage cortical qui sert à la mise en relation multimodale. Cette étude restreinte d’une carte modale vise plusieurs buts.

Premièrement, elle permet de valider notre approche d’un apprentissage progressif et d’étudier sa dyna-mique avant d’envisager l’intégration des cartes modales au sein d’une architecture plus large, permettant le traitement multimodal de l’information. De plus, d’un point de vue pratique, le fonctionnement isolé de la carte modale permet de trouver un jeu de paramètres offrant les propriétés recherchées, ce qui facilitera son intégration dans un cadre multimodal. La possibilité de pouvoir paramétrer chaque carte de notre modèle indépendamment est intéressante pour leur utilisation pratique au sein d’un modèle complexe tel que le nôtre.

Deuxièmement, le traitement de l’information effectué par une carte modale isolée correspond, par rapport à SOMMA, au traitement d’un stimulus purement monomodal. La validation du fonctionnement d’une carte modale isolée permet ainsi de garantir le traitement de stimuli monomodaux par SOMMA. Cela nous apparaît important dans l’optique d’un agent autonome car certains événements de l’environnement peuvent n’être captés que par une modalité.

Nous attendons qu’une carte modale isolée fournisse plusieurs propriétés (voir le chapitre 3 pour plus de détails).

Premièrement, elle doit permettre l’apprentissage des corrélations monomodales présentes dans le flux d’entrée.

Deuxièmement, elle doit fournir une représentation, appelée perception, du stimulus courant en utilisant les corrélations apprises.

Troisièmement, cette perception du stimulus courant doit être généralisable à des stimuli inconnus, ce qui signifie qu’elle doit être proche de celle fournie à des stimuli proches précédemment appris.

Quatrièmement, la représentation du stimulus courant doit être de plus faible dimension intrinsèque que celle du stimulus afin de limiter le problème de fléau de la dimensionnalité lors de la mise en relation multimodale.

Cinquièmement, l’ensemble de ces propriétés doit être obtenu grâce à un paradigme connexionniste avec un apprentissage continu et non supervisé afin de fournir une propriété de robustesse au modèle, à savoir son adaptabilité à un flux d’entrée changeant et sa tolérance aux pannes.

Afin d’obtenir les propriétés de généralisation et de réduction de dimensionnalité, nous avons choisi d’utiliser le paradigme des cartes auto-organisatrices (voir le chapitre 4) pour notre carte modale isolée. Si-tuons l’architecture des cartes modales de notre modèle (voir figure 6.1) par rapport à ce paradigme. Dans notre modèle, les cartes modales sont constituées de colonnes corticales génériques qui correspondent aux unités des cartes auto-organisatrices. L’étage de détection des cartes auto-organisatrices s’appelle étage sensoriel dans notre modèle dans le sens où il fournit une représentation primaire du stimulus courant. L’étage de sélection, quant à lui, correspond à l’étage perceptif car il fournit une représentation du

mulus courant.

Afin d’obtenir une perception généralisable, nous proposons l’utilisation du paradigme des champs neu-ronaux continus pour l’étage perceptif. Ce paradigme permet l’émergence d’une bulle d’activité offrant un codage spatial continu qui, couplé à l’organisation spatiale des sélectivités de l’étage sensoriel, fournit un mécanisme de généralisation de la perception aux stimuli inconnus (voir le chapitre 4 pour plus de détails).

Pour l’obtention de l’apprentissage des corrélations présentes dans le flux monomodal d’entrée, nous avons choisi la règle d’apprentissage BCM pour l’étage sensoriel. D’une part, elle permet un apprentis-sage autonome d’un codage tabulaire à une corrélation du flux d’entrée sans nécessiter l’hypothèse de l’existence d’une distance connue pour l’environnement. D’autre part, ce codage est plastique vis-à-vis d’une modification de l’environnement. Par ailleurs, les propriétés de la règle BCM facilitent son couplage avec le paradigme de la CNFT (voir le chapitre 5 pour plus de détails).

Dans une première section, nous détaillons notre modèle de carte modale isolée (voir l’annexe A pour des détails sur l’implémentation logicielle). Bien que l’architecture des cartes modales ait été conçue dans le but d’une mise en relation multimodale, ce modèle est fonctionnel pour le traitement d’un flux mono-modal. Il est, à ce titre, l’un des rares modèles de cartes auto-organisatrices qui permet l’apprentissage et la généralisation des informations contenues dans son flux d’entrée, en respectant un paradigme de calculs et d’apprentissages locaux, distribués, décentralisés et non supervisés. Dans une seconde section, nous illustrons le fonctionnement et les propriétés de notre modèle de carte modale avec des environnements monomodaux variés.

6.1 Modèle

Dans notre modèle SOMMA, une carte modale est constituée d’un ensemble de colonnes corticales génériques organisées suivant une grille bidimensionnelle. Dans ce chapitre, comme nous nous intéressons à une carte modale isolée, chaque colonne se compose uniquement d’un étage sensoriel et d’un étage perceptif, l’étage cortical servant à la mise en relation multimodale n’étant pas considéré (voir figure 6.1). L’activité sensorielle (respectivement perceptive) au temps t de la colonne corticale située à la ièmeligne et à la jèmecolonne de la carte modale m est notée us(cm

i,j, t) (respectivement up(cm

i,j, t)). Le vecteur de poids des connexions montantes (ou poids montants) de cette colonne au temps t est noté wFF

(cm i,j,t). L’activité sensorielle des colonnes ainsi que la modification de leurs poids montants sont calculés en utilisant la règle BCM décrite dans le chapitre 5. L’étage perceptif de chaque colonne est relié aux étages perceptifs de toutes les autres colonnes de la carte par des connexions de poids latéraux fixes définissant, pour la colonne cm

i,j, une matrice de connectivité notée wL

(cm

i,j). L’activité perceptive de chaque colonne évolue suivant le paradigme de la CNFT présenté dans le chapitre 6 et prend comme terme afférent l’activité sensorielle.

Nous décrivons dans cette section les étages sensoriels et perceptifs par rapport à trois points. Premièrement, nous précisons leurs rôles et leurs propriétés vis-à-vis de la carte modale qui ont été décrits dans le chapitre 3.

Deuxièmement, nous introduisons les équations utilisées pour faire évoluer leurs activités et les poids de leurs connexions le cas échéant. En effet, l’utilisation pratique de la règle BCM et du paradigme de la CNFT au sein d’un modèle informatique nécessite l’adaptation des équations et leur paramétrisation. Troisièmement, nous nous efforçons de décrire, autant que possible, les moyens pratiques pour le réglage de ces paramètres, afin d’obtenir le comportement émergeant voulu.