Résultats

4.3 Conclusion

_S^{M aitre}

_S^{M aitre}

4.3 Conclusion

5.1.4 Résultats

5.1.4.1 Évolution de l’apprentissage

Commençons par observer l’évolution de l’apprentissage des simulations de notre modèle en

étu-diant l’entropie des branches auditive et motrice au cours de l’apprentissage (voir Fig. 5.5). Du fait que

les trois répertoires sont appris en même temps, nous avons superposé dans une même figure

l’évolu-tion de l’entropie de la branche auditive et de la branche motrice. L’analyse de cette évolul’évolu-tion permet

de surligner trois différences entre les branches auditives et motrice : la vitesse d’apprentissage, la

convergence et la variabilité.

FIGURE5.5 – Évolution des branches auditive et motrice au cours de l’apprentissage

Nous observons d’abord que les deux branches n’ont pas la même vitesse d’apprentissage. La

branche sensorielle converge très rapidement. En effet, il faut moins de 1 000 itérations pour qu’elle

atteigne son point de convergence. Au contraire, la branche motrice est beaucoup plus lente. Après

20 000 itérations, elle ne semble toujours pas avoir convergé puisque son entropie continue de

di-minuer. On peut alors supposer qu’il est beaucoup plus simple pour l’agent d’apprendre sa branche

sensorielle que sa branche motrice. Ce comportement semble logique puisque le répertoire sensoriel

est appris à partir d’un apprentissage supervisé tandis que le modèle interne et le répertoire moteur sont

tous deux appris par accommodation. Il faut donc un certain temps avant que l’agent apprenne, d’un

côté, à associer des représentations sensorielles perçues à des représentations motrices adéquates et,

d’un autre côté, qu’il apprenne à associer ses représentations motrices à la catégorie correspondante.

Concernant leur point de convergence respectif, nous remarquons que l’entropie de la branche

auditive converge vers celle du maître mais qu’elle conserve une erreur résiduelle. Le premier point

suggère que la branche auditive réussit à apprendre correctement les données du maître. Concernant

l’erreur résiduelle, elle s’explique par le fait que le répertoire sensoriel approxime les données d’une

catégorie du maître comme une gaussienne alors que la distribution sensorielle de l’environnement

P(S

|O

) qu’il apprend n’est pas gaussienne. Du côté de la branche motrice, son entropie

est bien plus élevée que celle du maître et que celle de la branche auditive, ce qui suppose une

approxi-mation moins bonne que celle de la branche auditive. Le fait que l’entropie de la branche motrice soit

plus élevée, mais qu’elle continue sa décroissance tout au long de l’apprentissage, laisse par ailleurs

supposer qu’elle pourrait rejoindre l’entropie du maître si on prolongeait l’apprentissage. C’est en

effet le comportement attendu selon le théorème d’indistinguabilité.

La troisième différence concerne la variabilité. L’entropie de la branche auditive est très stable

d’une simulation à l’autre ce qui est cohérent avec le fait qu’elle approxime toujours très rapidement

l’entropie du maître. En revanche, l’entropie de la branche motrice est très variable. Il apparaît ainsi

que l’apprentissage moteur varie selon les simulations : certains agents arrivent à avoir des branches

motrices proches de la distribution sensorielle de l’environnement très rapidement tandis que d’autres

sont au contraire beaucoup moins précis et n’approximent que globalement la distribution du maître.

préci-sion, est une très bonne approximation des données du maître, et se focalise ainsi efficacement sur les

régions sensorielles adéquates dans l’espace d’apprentissage. L’apprentissage de la voie motrice, au

contraire, combinant les termes d’apprentissage sensorimoteur et moteur, fournit dans la majorité des

cas une approximation plus lente et moins précise des données du maître, explorant des régions plus

larges de l’espace sensoriel.

5.1.4.2 Comparaison des tâches de catégorisation

Nous comparons maintenant les trois décodeursP(OL |S),P(OS |S) etP(OS |S [C = 1])

à l’aide de la tâche de catégorisation définie en section 5.1.3.2. Les scores de reconnaissance des

catégories pour les trois décodeurs et pour différents niveaux de bruit sont présentés Fig. 5.6. Les trois

cases de cette figure correspondent à l’observation des résultats lorsque l’on arrête l’apprentissage à

trois moment différents : 500 itérations (c’est-à-dire pour un volume d’apprentissage encore faible

pour chacun des décodeurs), 2 000 itérations (à un moment où l’apprentissage sensoriel a convergé,

mais pas l’apprentissage moteur) et 20 000 itérations (pour lequel l’apprentissage moteur a, à peu

près, convergé). Nous étudions d’abord globalement les trois décodeurs avant de nous focaliser sur les

spécificités relatives aux trois moments sélectionnés.

FIGURE5.6 – Étude de la performance de catégorisation à différents niveaux d’apprentissage

Dans un premier temps, nous observons que, de manière globale, dans toutes les conditions, le

décodeur perceptuo-moteur donne de meilleurs performances que les deux autres décodeurs. Il semble

donc plus efficace de fusionner les décodeurs auditif et moteur que de les utiliser séparément. Nous

remarquons que le décodeur perceptuo-moteur est très vite performant. En effet, dès 500 itérations,

il catégorise parfaitement les deux objets (score de reconnaissance à 1). Cependant, la qualité de

catégorisation diminue avec le niveau de bruit. Ce résultat est concordant avec les résultats obtenus

dans la littérature (voir, par exemple, les études présentées section 3.1.1.2). Néanmoins, même avec un

niveau de bruit très élevé (10 fois l’écart-type du niveau de bruit normal), le score de reconnaissance

est au dessus du niveau du hasard (qui est à 0,5 puisqu’il y a deux objets).

Comparons maintenant les décodeurs auditif et moteur. Nous remarquons d’abord que le décodeur

auditif est meilleur que le décodeur moteur dans des conditions non bruitées. Dans ces conditions, il

est, comme le décodeur perceptuo-moteur, très rapidement performant, puisque son score de

recon-naissance est quasiment parfait dès 500 itérations. En revanche, dès qu’un peu de bruit est ajouté,

le score diminue drastiquement et est inférieur à 75% pour un bruit à 2. Par ailleurs, le score de

re-connaissance se stabilise par la suite quand le niveau de bruit augmente puisqu’il ne diminue que

d’environ 10 à 15% entre un bruit à 2 et un bruit à 10. Du côté du décodeur moteur, les scores dans

des conditions non bruitées sont moins bons que ceux du décodage sensoriel en début d’apprentissage

(environ 80% de reconnaissance) mais s’en rapprochent avec l’apprentissage : le score est quasiment

parfait à 20 000 itérations. Fait intéressant, quand du bruit est ajouté, les performances du décodeur

moteur diminuent, bien sûr, mais deviennent meilleures que celles du décodeur auditif.

Focalisons-nous maintenant quelques instants sur l’apprentissage. Entre 500 et 20 000 itérations,

nous observons finalement que le seul décodeur qui s’améliore significativement est le décodeur

mo-teur. Les deux autres ne semblent pas beaucoup évoluer (moins de 5% d’amélioration) mais ce

résul-tat est contrasté par le fait que dès 500 itérations, les décodeurs auditif et perceptuo-moteur semblent