3.3 Apprentissage de compétences motrices par accomodation
3.3.5 Propriétés des modèles appris
Dans cette section nous proposons d’illustrer ce qui a été appris par l’agent au travers de ses
interactions avec le maître et de ses tentatives d’imitation. Nous présentons les modèles appris
au cours d’une réalisation de notre algorithme d’apprentissage. Puisque cet algorithme fait
intervenir des tirages aléatoires, des initialisations différentes du générateur aléatoire conduiront
à des choix différents de stimuli pour le maître, et de gestes moteurs différents pour l’agent qui
l’imite. Cependant, les données que nous allons présenter permettent d’illustrer qualitativement
des principes qui ont été reproduits dans toutes les simulations qui ont été faites dans le cadre
des travaux de cette thèse.
Le modèle interne appris
La figure 4.6 montre le modèle interne de la transformation articulatori-acoustique que
l’agent s’est constitué au cours d’une réalisation de l’algorithme d’apprentissage, dans le cas
non-linéaire (la pente de la sigmoïde est à 0,8), et après 100 000 itérations de l’algorithme.
Figure 4.6: Le modèle interne appris par l’agent pour la transformation
articulatori-acoustique après convergence de l’apprentissage par accomodation du système sensori-moteur.
Cette figure montre, pour chaque valeur m de la variable M, la distribution de probabilité
P(S | [M=m] π
Ag) qui décrit la connaissance que l’agent a accumulée dans son modèle interne
sur les conséquences perceptivesS de la consigne motricem.
Comme le montre la figure 4.6, l’agent capture dans son modèle interne une représentation
approximative de la fonction sigmoïde reliant M etS (qui est présentée figure 4.3). Les
distri-butions P(S | [M=m] π
Ag) apprises par l’agent dans son modèle interne se répartissent en
trois groupes :
• des distributions très plates, quasiment uniformes, comme par exemple dans la région des
valeurs très négatives de M, pour lesquelles l’agent n’a rien appris du tout ;
• des distributions très piquées, autour des zones des S donnés à imiter par le maître,
qui montrent que l’agent a bien appris la transformation articulatori-acoustique dans ces
régions-là ;
• des distributions intermédiaires, qui montrent qu’ailleurs la représentation que l’agent
s’est construit dans son modèle interne est encore relativement imprécise.
En résumé, l’agent connaît bien les zones de l’espace sensori-moteur qui correspondent aux
stimuli fournis par le maître, mais dans le reste de l’espace il n’a que des connaissances très
partielles, qui sont issues du début de l’apprentissage.
Les répertoires moteurs appris
La figure 4.7 montre les prototypes de gestes moteurs vers lesquels l’agent a convergé après
apprentissage par imitation du maître.
Figure 4.7: Les répertoires moteurs appris par l’agent lors de l’apprentissage du
sys-tème moteur par accomodation. À gauche, après un petit nombre d’itérations ; à droite après
convergence de l’apprentissage.
Dans le cas où la transformation articulatori-acoustique est linéaire, l’agent aligne
progres-sivement ses productions sur celles du maître : on passe, dans l’exemple présenté sur la figure
4.7 de µ
Mo−≈ −2.5 et µ
Mo+≈ 8 au début de l’apprentissage à µ
Mo−= −5 et µ
Mo+= 5 après
convergence. Ce sont en effet les seules valeurs qui peuvent permettre de bien atteindre les
cibles données par le maître au cours de l’apprentissage. On observe donc que, même si l’agent
semble initialement avoir ancré des choix moteurs, la nécessité de devoir imiter le maître va
petit-à-petit l’amener à corriger ces choix.
Considérons maintenant les cas non-linéaires. Une transformation articulatori-acoustique
non-linéaire est caractérisée par l’existence de plateaux pour lesquels une variation de la consigne
motrice ne provoque que peu ou pas de variation de la conséquence acoustique. Dans ce cas
l’agent a donc un grand choix de gestes moteurs permettant d’atteindre une cible. En ce
sens, une transformation articulatori-acoustique non-linéaire gomme dans l’espace acoustique
des différences présentes dans l’espace moteur.
Dans ce cadre, le mécanisme d’ancrage dans les répertoires moteurs des premiers choix de
gestes à associer aux objets au début de l’apprentissage permet à l’agent de développer des
idiosyncrasies. En effet, alors que pour atteindre une cible correspondant à l’objet o l’agent a
initialement un grand nombre de gestes moteurs parmi lesquels il peut choisir, à chaque fois
que l’agent choisit un geste m, il met à jour le prototype moteur correspondant à l’objet o en
conséquence, ce qui a pour effet d’augmenter la probabilité que ce gestemsoit associé à nouveau
à l’objet olors d’une étape future de l’apprentissage.
C’est ce qu’illustre par exemple le cas fortement non-linéaire présenté sur la figure 4.7 :
au début de l’apprentissage on a les mêmes valeurs µ
Mo−≈ −2 et µ
Mo+≈ 10 qu’à la fin de
l’apprentissage. Les choix faits initialement, qui permettaient d’atteindre les cibles à imiter, se
sont renforcés, si bien que l’agent s’est construit des prototypes de gestes moteurs très différents
de ceux du maître (dont les moyennes sontµ
Mo−=−5 et µ
Mo+= 5).
En revanche, dans le cas non-linéaire de la figure 4.7, les moyennes des prototypes moteurs
de l’agent passent deµ
Mo−≈ −3 etµ
Mo+≈10 au début de l’aprentissage àµ
Mo−≈ −5 etµ
Mo+≈10
après convergence. Alors que le prototype moteur que l’agent associe à l’objet o
+a la même
moyenne au début et à la fin de l’apprentissage, celui correspondant à l’objeto
−voit sa moyenne
changer. La raison en est qu’au début de l’apprentissage l’agent associe dans ses répertoires
moteurs P(M | [O
S=o
−] π
Ag) une probabilité non négligeable à des gestes moteurs M > 0.
De tels gestes, dont l’image par la fonction sigmoïde non-linéaire sera très éloignée de la cible
donnée par le maître, ont donc une probabilité très élevée de ne pas être choisis pour la tâche
d’imitation. Du coup, le mécanisme d’ancrage aura pour effet de diminuer progressivement le
poids relatif de ces gestes qui sont de mauvais candidats en augmentant le poids des autres, ce
qui a pour effet de décaler progressivement la moyenne µ
Mo−de −3 vers−5. Cela montre que
l’ancrage des idosyncrasies grâce au mécanisme de renforcement que nous avons proposé ne se
fait pas au détriment de la capacité à atteindre les cibles proposées par le maître.
On peut donc résumer le comportement de notre algorithme d’apprentissage par
accomoda-tion à deux idées simples :
• L’accumulation de connaissances grâce au paradigme d’imitation permet de choisir des
gestes permettant d’atteindre les cibles proposées par le maître.
• Si, comme c’est le cas lorsque la transformation articulatori-acoustique est non-linéaire, il
y a plusieurs candidats de gestes moteurs permettant d’atteindre aussi bien les cibles, il
n’y a alors rien qui pousse l’agent à converger vers les mêmes prototypes de gestes moteurs
que ceux du maître. Dans ce cas, l’agent privilégie les gestes qu’il a déjà choisis par le
passé, et ancre ainsi des choix idiosyncrasiques.
4 Comparaisons au sein de COSMO des prédictions des
théories motrice, auditive et perceptuo-motrice de la
perception
Dans la section précédente nous avons décrit des algorithmes permettant d’apprendre grâce
aux mêmes données (les couples < s, o > associant objets et entrées perceptives fournis par
l’agent maître) les paramètres du système perceptif, ceux du sytème sensori-moteur, et ceux
du système moteur. Il s’agit maintenant d’évaluer comparativement les modèles auditif,
mo-teur et perceptuo-momo-teur de la perception, et de tester leur robustesse aux conditions adverses
en comparant leurs performances respectives en fonction du niveau de dégradation du signal
dans l’environnement au moment du test. Pour cela, nous commençons par nous assurer que
l’algorithme d’apprentissage par accomodation que nous avons mis en place nous a bien permis
de nous écarter des hypothèses de notre théorème d’indistinguabilité.
Dans le document
COSMO : un modèle bayésien des interactions sensori-motrices dans la perception de la parole
(Page 85-88)