• Aucun résultat trouvé

La CNFT comme étage de sélection d’une carte de Kohonen

4.2 Théorie des champs neuronaux continus

4.2.3 La CNFT comme étage de sélection d’une carte de Kohonen

L’étage de sélection d’une carte auto-organisatrice doit fournir un mécanisme compétitif de type winner takes most à partir de l’activité de l’étage de sélection. Afin de satisfaire cette propriété, nous considérons le paradigme de la CNFT avec un profil de connexion latérale ayant une partie inhibitrice sur toute la carte afin de garantir l’unicité de la bulle d’activité émergente. Nous étudions dans cette section

Figure4.8 – À gauche (respectivement à droite) est représenté l’évolution du terme afférent de l’équa-tion 4.2 (respectivement de l’activité du champ) en foncl’équa-tion du temps. Les activités sont figurées en niveau de gris suivant l’échelle mise à côté. Les deux entrées soumises successivement au champ contiennent une gaussienne centrée sur le même point de l’espace mais qui ont des variances différentes. Ces entrées sont additionnées d’un bruit uniforme. On constate que le champ fait émerger une activité sous la forme d’une bulle malgré la présence de bruit et que la largeur de la bulle est constante, peu importe l’entrée, car elle est contrainte par la partie excitatrice de la connectivité latérale utilisée.

l’utilisation d’un tel paradigme en tant qu’étage de sélection d’une carte de Kohonen (voir la section 4.1.3). L’activité de détection di(t) d’une unité ui au temps t ainsi que la mise à jour du prototype wi(t) sont ainsi mises à jour suivant les règles définies par Kohonen, qui sont, pour rappel :

di(t) = e||wi (t),x(t)||α2

∀ui, dwi(t)

dt = ǫ∗ si(t) ∗ (x(t) − wi(t))

avec x(t) le stimulus courant. Pour les autres notations, se reporter à la section 4.1.3. Utilisation comme étage de sélection

Une carte auto-organisatrice est composée d’unités, organisées suivant une topologie, qui définissent un espace discret. Or, l’équation de la CNFT décrit l’évolution d’un champ de neurones répartis sur un substrat continu. Afin de l’utiliser dans une carte auto-organisatrice, nous discrétisons spatialement l’équation de la CNFT afin de ne l’évaluer qu’aux emplacements des unités composant la carte. Ainsi, l’activité de sélection si(t) de l’unité ui au temps t est calculée suivant l’équation :

∂si(t) ∂t = −si(t) + f  X j6=i w(||ui, uj||2)sj(t)  + di(t) + h (4.3)

4.2. Théorie des champs neuronaux continus 73

Figure 4.9 – Dans ce scénario, l’entrée initiale du champ contient une gaussienne. Comme attendu, l’équation de la CNFT fait émerger une bulle d’activité spatialement localisée au niveau de la gaussienne. On ajoute ensuite une autre gaussienne de plus forte amplitude et de même variance au terme afférent, en conservant la première présentée. On constate que l’activité du champ ne change pas alors que l’activité afférente est maintenant plus spatialement cohérente à l’emplacement de la nouvelle gaussienne. Cette dynamique, appelée résistance aux distracteurs, est due à l’auto-excitation de la bulle d’activité provoquée par l’influence du terme latéral.

w est une fonction définissant la connectivité, en différence de gaussiennes, entre les unités, ||.||2 est la distance entre les colonnes se basant sur la topologie fixée pour la carte, f représente la fonction d’activation de l’unité, di(t) est l’activité de l’étage de détection de la colonne ui et h représente le potentiel de repos de l’unité.

Une telle discrétisation spatiale du calcul engendre des erreurs de calculs de l’évolution de l’équation différentielle. Cependant, les propriétés de la CNFT présentée dans la section 4.2.2 restent valables en pratique avec cette discrétisation.

Par ailleurs, l’utilisation du paradigme des champs neuronaux en tant qu’étage de sélection d’une carte auto-organisatrice modifie la dynamique de cette dernière. En effet, la convergence de l’activité de sélection vers une bulle d’activité prend une certaine durée. D’une part, ceci nécessite le maintien de présentation du stimulus à la carte afin de permettre la stabilisation de l’activité. D’autre part, ce temps de stabilisation nécessaire à la convergence de l’équation 4.3 engendre une activité de sélection erronée par rapport à l’entrée détectée et donc un apprentissage incohérent. Afin de minimiser cet effet, la présentation du stimulus peut être maintenue suffisamment longtemps pour que le temps de convergence soit négligeable par rapport au temps de présentation total du stimulus. Ainsi, la constante de temps pour l’apprentissage doit être choisie très inférieure à celle utilisée pour le calcul de l’activité de sélection.

Un mécanisme compétitif permettant apprentissage continu et généralisation

Les champs neuronaux proposent un mécanisme compétitif de type winner takes most qui conduit à l’émergence d’une bulle d’activité (voir section 4.2.2). La forme de la bulle est stéréotypée ce qui signifie en particulier que sa largeur est constante peu importe l’entrée fournie. Comme l’activité de sélection dirige l’apprentissage des prototypes des unités, une bulle de largeur constante permet un apprentissage continu, de la même manière qu’une gaussienne de taille constante dans le modèle de Kohonen (voir la section 4.1.3).

Bien que, dans le cadre d’une carte auto-organisatrice, l’équation de la CNFT ne soit évaluée qu’aux emplacements discrets des unités, son paradigme se fonde sur un substrat de calcul continu. En consé-quence, la bulle d’activité émergente n’est pas forcément centrée sur une unité de la carte mais peut être localisée en tout endroit de l’espace continu. Cette continuité du codage spatial de l’étage de sélection permet ainsi d’obtenir une activité de sélection distincte pour des stimuli différents. Combinée à l’or-ganisation topologique des discriminations de l’étage de détection, cette bulle d’activité offre un codage spatial continu qui permet un mécanisme de généralisation des discriminations apprises pour l’ensemble de l’espace.

Conséquences de la propriété de robustesse aux distracteurs sur la dynamique

L’utilisation du paradigme de la CNFT en tant qu’étage de sélection d’une carte de Kohonen per-met ainsi d’obtenir un modèle fournissant trois des quatre propriétés recherchées pour notre modèle de carte modale : une représentation du stimulus courant de plus faible dimension que celle du stimulus, représentation qui est généralisable à des stimuli inconnus. Cependant, nous allons voir dans cette section que l’intégration du paradigme de la CNFT au sein de la dynamique d’auto-organisation de la carte est rendue difficile par la propriété de robustesse aux distracteurs de la CNFT.

Étudions le comportement de la CNFT par rapport aux différents comportements attendus pour l’étage de sélection au cours du temps (voir figure 4.10).

Au début de l’apprentissage, les discriminations de l’étage de détection ne sont pas spatialement orga-nisées. L’étage de sélection doit alors fournir une bulle d’activité qui est différente suivant les stimuli afin qu’ils soient appris dans des zones différentes de la carte. Lors de la réception du premier stimulus, la CNFT est capable de faire émerger une bulle d’activité. Lors du changement de stimulus, comme les discriminations ne sont pas organisées dans la carte, l’activité de détection risque de ne pas disparaître là où la bulle est apparue, et de ne pas être significativement plus forte à un autre emplacement. Par la propriété de résistance aux distracteurs de la CNFT, la bulle d’activité peut rester fixe, ce qui n’est pas le comportement souhaité.

Une fois que l’apprentissage commence à converger, la réception d’un stimulus provoque l’apparition d’activités spatialement localisées dans l’étage de détection. L’étage de sélection doit alors fournir une bulle d’activité là où l’activité de détection est forte. La CNFT fournit ce comportement puisque la bulle émerge là où l’activité afférente, ici l’activité de détection, est la plus spatialement cohérente. De plus, comme l’activité de détection est significativement différente pour des stimuli différents, la bulle d’activité change de localisation lors de la réception d’un nouveau stimulus par la carte.

Nous avons vu dans la section 4.1.3 que, dans le modèle de Kohonen, le prototype d’une unité était égal à la moyenne des stimuli reçus pondérés par l’activité de sélection. En cas d’utilisation de la CNFT pour le calcul de l’activité de sélection, nous venons de mettre en lumière que la bulle d’activité pouvait rester fixe au début de l’apprentissage. Cela a pour conséquence que les unités sous la bulle convergent vers la moyenne des stimuli reçus. En pratique, on obtient ainsi une auto-organisation dans laquelle tous les prototypes sont proches de la moyenne de l’espace d’entrée (voir figure 4.11). La carte ne représente alors pas bien l’espace d’entrée puisqu’aucune unité n’est sensible à des stimuli éloignés de la moyenne de l’espace d’entrée. Pour une étude plus détaillée des problèmes liés à l’utilisation des champs neuronaux dynamiques pour les cartes de Kohonen, le lecteur est invité à se référer à l’étude menée par Alecu [Alecu et al., 2011].

4.2. Théorie des champs neuronaux continus 75 (1) (2) (3) (4) (1) (2) (3) (4)

activité de détection activité de sélection

Figure4.10 – Nous testons le comportement de la CNFT en utilisant un scénario représentatif des diffé-rentes activités de détection au cours de l’apprentissage d’une carte auto-organisatrice mono dimension-nelle. L’évolution au cours du temps de l’activité de détection (respectivement sélection) est représentée à gauche (respectivement à droite). Au début de l’apprentissage, les discriminations ne sont pas organisées dans la carte. La réception du premier stimulus (1) amène à une activité de détection qui est répartie dans toute la carte. La CNFT fait alors émerger une bulle d’activité dans l’étage de sélection. Lors de la réception d’un nouveau stimulus au niveau de la carte (2), l’activité de détection change mais pas de manière significative. La bulle d’activité reste fixe par la propriété de robustesse aux distracteurs de la CNFT. Une fois la carte auto-organisée, la réception de deux stimuli différents donne lieu à une activité de détection spatialement localisée à deux endroits différents ((3) et (4)). La bulle d’activité dans l’étage de sélection se déplace alors à l’endroit où l’activité de détection est la plus spatialement cohérente.

Adaptation de l’équation d’Amari

Nous venons de voir que l’utilisation couplée de la CNFT, en tant qu’étage de sélection, avec l’étage de détection d’une carte de Kohonen pose problème à cause de la propriété de résistance aux distracteurs exhibée par la CNFT. Plusieurs solutions ont été proposées dans la littérature, toutes utilisant une modification de la CNFT.

Figure4.11 – Auto-organisation d’une carte monodimensionnelle avec l’utilisation de l’étage de détection proposé par Kohonen et d’un étage de sélection utilisant l’équation de la CNFT. Les stimuli reçus par la carte sont tirés de manière aléatoire uniforme dans l’espace d’entrée figuré en gris. Les prototypes des différentes unités correspondent aux cercles blancs et les traits représentent la topologie de la carte. À cause de la stabilité de l’activité de sélection, due à la propriété de résistance aux distracteurs de la CNFT, les prototypes sont proches de la moyenne des stimuli reçus et ne représentent pas l’espace d’entrée (tiré de [Alecu et al., 2011]).

l’activité de sélection à chaque nouvelle présentation d’un stimulus. Ainsi le terme latéral est nul dans toute la carte et une bulle émerge bien à l’endroit le plus spatialement cohérent. Cette solution n’est pas satisfaisante de notre point de vue car elle nécessite non seulement un mécanisme centralisé de remise à zéro de l’activité mais surtout une supervisation du flux d’entrée afin de connaître le moment de changement de stimulus.

Une autre solution a été développée par Alecu [Alecu et al., 2011] de manière simultanée à notre travail. Elle consiste à définir un modèle de champs neuronaux spécifiquement adapté aux comportements souhaités pour l’étage de sélection. Le modèle, appelé BINP (Back Inhibited Neural Population), définit un champ neuronal constitué d’une population excitatrice et d’une population inhibitrice en interaction. L’activité de la population excitatrice (respectivement inhibitrice) au point x et au temps t est notée u(x, t) (respectivement v(x, t)) et évolue selon l’équation suivante :

∂u(x, t) ∂t = −u(x, t) | {z } terme de fuite + αE(x, t) − βI(x, t) | {z } terme latéral + i(x, t) | {z } terme afférent −γg(i, v) | {z } terme de rétroinhibition ∂v(x, t) ∂t = h(E(x, t)) avec w+(r) = e−ar2 E(x, t) = σ1( Z M w+(x − x)f (u(x, t))dx) w(r) = e−br2− e−cr2 I(x, t) = σ2( Z M w(x − x)f (u(x, t))dx)

σ1, σ2 et f sont des sigmoïdes et les fonctions g et h sont montrées figure 4.13. w+ (respectivement w) correspond approximativement à la partie excitatrice (respectivement inhibitrice) de la connecti-vité latérale en différence de gaussiennes utilisée dans le modèle d’Amari (voir figure 4.12). Ainsi E(x, t) (respectivement I(x, t)) correspond grossièrement à l’influence latérale excitatrice (respectivement inhi-bitrice).

4.2. Théorie des champs neuronaux continus 77

Figure4.12 – Profil de la connectivité latérale excitatrice w+(dx) et inhibitrice w(dx) (tiré de [Alecu et al., 2011]).

Figure4.13 – À gauche, la fonction g a une activité forte si v est fort et i est faible ce qui correspond à la localisation de la bulle sur une activité afférente faible. À droite, la fonction h permet au champ v de suivre l’activité de l’excitation latérale du champ u avec une dynamique plus lente (tiré de [Alecu et al., 2011]).

L’activité u de la population excitatrice suit l’équation proposée par Amari à laquelle est ajouté un terme d’inhibition, dépendant de l’activité v de la population inhibitrice. L’activité v, quant à elle, dépend de l’excitation latérale de la population excitatrice, ce qui fait émerger une bulle d’activité dans la population inhibitrice à l’endroit où la bulle a émergé dans la population excitatrice mais avec une dynamique plus lente. L’originalité du modèle BINP réside dans l’emploi de la fonction g pour moduler le terme d’inhibition de la population excitatrice (voir figure 4.12). Le terme d’inhibition n’est ainsi fort que si le terme afférent est faible et v est fort, ce qui signifie qu’une bulle d’activité est apparue dans la population excitatrice à un endroit où le terme afférent est faible.

Utilisé comme étage de sélection d’une carte de Kohonen, le champ neuronal BINP permet de contre-carrer la propriété de résistance aux distracteurs de l’équation de la CNFT qui posait problème lors du début de l’apprentissage, grâce au terme d’inhibition modulée, tout en conservant les autres propriétés de la CNFT (voir figure 4.14). En effet, d’un point de vue dynamique, BINP a un comportement différent de celui de la CNFT lorsque les discriminations ne sont pas organisées dans la carte et que l’activité de détection n’est donc pas spatialement localisée. Dans ce cas, BINP va faire émerger une bulle d’activité

qui sera inhibée par la suite car l’activité de détection sera trop faible pour empêcher l’influence du terme d’inhibition. On assiste alors à l’émergence cyclique de bulles d’activités dans le champ permettant d’amorcer l’auto-organisation des discriminations dans la carte.

(1) (2) (3) (4) (1) (2) (3) (4)

activité de détection activité de sélection

Figure4.14 – Nous testons ici le comportement du modèle BINP sur le même scénario que celui présenté figure 4.10. La dynamique du champ pour les deux dernières entrées est similaire à celle de l’équation de la CNFT car le terme d’inhibition est nul de par sa modulation par la fonction g. En revanche, sur les deux premiers exemples, on peut voir l’influence du terme d’inhibition qui supprime la bulle car l’activité de détection n’est pas assez forte. La bulle va alors émerger de manière cyclique à une autre localisation. Bien que BINP fonctionne en pratique pour une carte auto-organisatrice, nous pouvons cependant émettre deux réserves vis-à-vis de son comportement possible dans le modèle SOMMA au début de l’apprentissage. Premièrement, pour deux activités de détection identiques, le champ peut faire émerger deux bulles d’activités différentes suivant sa dynamique précédente. Or, comme cette activité est utilisée pour la mise en relation multimodale (voir le chapitre 7), cela pourrait poser problème pour le traitement de l’information multimodale. Deuxièmement, cette succession d’émergences de bulles puis d’inhibitions de ces dernières crée un rythme propre à la carte. Ces différents rythmes risquent de poser un problème pratique pour l’émergence et la stabilité d’une perception multimodale, l’ensemble des bulles modales pouvant ne pas être présentes au même moment.

Pour ces raisons, nous avons opté dans notre modèle pour l’utilisation du paradigme de la CNFT pour le calcul de l’activité de sélection. Afin de permettre son utilisation au sein d’une carte auto-organisatrice, nous avons décidé d’utiliser la règle BCM (voir le chapitre 5) pour le calcul de l’activité de détection et l’apprentissage des discriminations. Cette règle permet, en outre, l’apprentissage d’une discrimination à

4.3. Conclusion 79 une corrélation présente dans le flux d’entrée. Cet apprentissage de corrélation est la dernière propriété attendue pour nos cartes modales, les trois autres étant permises par l’utilisation de la CNFT dans le paradigme des cartes auto-organisatrices.

4.3 Conclusion

Nous avons vu dans ce chapitre le paradigme informatique des cartes auto-organisatrices. Ces cartes sont composées d’unités génériques organisées suivant une topologie fixée. Au niveau architectural, chaque unité est constituée d’un étage de détection, correspondant dans notre modèle à l’étage sensoriel, qui fournit un codage tabulaire de l’environnement, et d’un étage de sélection, dans notre modèle l’étage perceptif, qui fournit un mécanisme compétitif de type winner takes most sur l’activité de détection. L’auto-organisation des discriminations de l’étage de détection est assuré par la boucle de rétroaction positive de l’activité de sélection, spatialement localisée, sur l’apprentissage de ces discriminations. Le paradigme de cartes auto-organisatrices répond à certaines des propriétés attendues pour notre modèle de carte modale. Premièrement, l’étage de détection fournit un codage spatial du stimulus courant. Deuxiè-mement, par ce codage spatial, l’espace d’entrée, ayant une grande dimensionnalité, est projeté sur un espace de plus faible dimension défini par la topologie d’organisation des colonnes au sein de la carte. Cette réduction de dimensionnalité de la représentation du stimulus courant permet de faciliter l’ap-prentissage des corrélations multimodales (voir la partie III). Troisièmement, l’organisation topologique des discriminations de l’espace d’entrée, permet leur extrapolation à des zones de l’espace non encore explorées. Cette propriété, combinée à l’utilisation d’un codage spatial continu de l’étage de sélection, permet une généralisation de la représentation des stimuli dans l’espace d’entrée.

Le modèle de cartes auto-organisatrices le plus couramment utilisé est le modèle proposé par Kohonen et sert de point de départ à notre étude. En tant que carte auto-organisatrice, ce modèle semble répondre à nos exigences. Cependant, plusieurs des propriétés de son étage de sélection sont en contradiction avec notre objectif. Premièrement, son mécanisme compétitif utilise un calcul centralisé, ce qui est en opposition avec notre volonté d’un paradigme bio inspiré de calcul locaux et décentralisés, permettant d’obtenir un système robuste à la défaillance d’une partie de son substrat de calcul. Deuxièmement, ce calcul fournit un codage spatial discret, car centré sur une unité de la carte. Cette discrétisation fournit une classification de l’espace d’entrée contraire à la généralisation de la représentation des stimuli. Pour pallier ces problèmes, nous proposons d’utiliser le paradigme des champs neuronaux proposé par Amari pour le calcul de l’activité de l’étage de sélection. En effet, en utilisant des calculs décentralisés, ce paradigme fournit un mécanisme compétitif de type winner takes most par l’émergence d’une bulle d’activité qui peut être localisée continûment sur l’espace défini par la carte. Cependant, l’interaction d’un étage de détection, inspiré des cartes de Kohonen, avec un étage de sélection utilisant la CNFT génère une incompatibilité. Cette dernière est due à la propriété de résistance aux distracteurs de la CNFT, la rendant incapable de fournir une bulle d’activité différente pour chaque stimulus lorsque l’activité de détection est dispersée sur toute la carte, comme c’est le cas au début de l’apprentissage. Ainsi, en pratique, les unités sous cette bulle fixe apprennent la moyenne des stimuli présentés et, au niveau de la carte, elles s’auto-organisent alors autour de la moyenne de l’espace d’entrée.

Les solutions proposées par la littérature pour résoudre ce problème sont fondées sur une modification de l’équation d’Amari afin de la rendre compatible avec l’étage de détection proposé par Kohonen. Parmi celles-ci, la seule qui réponde à notre contrainte d’un apprentissage continu et non supervisé, a été proposée par Alecu avec son modèle de champs neuronaux BINP. Son modèle permet de résoudre le