• Aucun résultat trouvé

3.3 Apprentissage de compétences motrices par accomodation

3.3.5 Propriétés des modèles appris

Dans cette section nous proposons d’illustrer ce qui a été appris par l’agent au travers de ses

interactions avec le maître et de ses tentatives d’imitation. Nous présentons les modèles appris

au cours d’une réalisation de notre algorithme d’apprentissage. Puisque cet algorithme fait

intervenir des tirages aléatoires, des initialisations différentes du générateur aléatoire conduiront

à des choix différents de stimuli pour le maître, et de gestes moteurs différents pour l’agent qui

l’imite. Cependant, les données que nous allons présenter permettent d’illustrer qualitativement

des principes qui ont été reproduits dans toutes les simulations qui ont été faites dans le cadre

des travaux de cette thèse.

Le modèle interne appris

La figure 4.6 montre le modèle interne de la transformation articulatori-acoustique que

l’agent s’est constitué au cours d’une réalisation de l’algorithme d’apprentissage, dans le cas

non-linéaire (la pente de la sigmoïde est à 0,8), et après 100 000 itérations de l’algorithme.

Figure 4.6: Le modèle interne appris par l’agent pour la transformation

articulatori-acoustique après convergence de l’apprentissage par accomodation du système sensori-moteur.

Cette figure montre, pour chaque valeur m de la variable M, la distribution de probabilité

P(S | [M=m] π

Ag

) qui décrit la connaissance que l’agent a accumulée dans son modèle interne

sur les conséquences perceptivesS de la consigne motricem.

Comme le montre la figure 4.6, l’agent capture dans son modèle interne une représentation

approximative de la fonction sigmoïde reliant M etS (qui est présentée figure 4.3). Les

distri-butions P(S | [M=m] π

Ag

) apprises par l’agent dans son modèle interne se répartissent en

trois groupes :

• des distributions très plates, quasiment uniformes, comme par exemple dans la région des

valeurs très négatives de M, pour lesquelles l’agent n’a rien appris du tout ;

• des distributions très piquées, autour des zones des S donnés à imiter par le maître,

qui montrent que l’agent a bien appris la transformation articulatori-acoustique dans ces

régions-là ;

• des distributions intermédiaires, qui montrent qu’ailleurs la représentation que l’agent

s’est construit dans son modèle interne est encore relativement imprécise.

En résumé, l’agent connaît bien les zones de l’espace sensori-moteur qui correspondent aux

stimuli fournis par le maître, mais dans le reste de l’espace il n’a que des connaissances très

partielles, qui sont issues du début de l’apprentissage.

Les répertoires moteurs appris

La figure 4.7 montre les prototypes de gestes moteurs vers lesquels l’agent a convergé après

apprentissage par imitation du maître.

Figure 4.7: Les répertoires moteurs appris par l’agent lors de l’apprentissage du

sys-tème moteur par accomodation. À gauche, après un petit nombre d’itérations ; à droite après

convergence de l’apprentissage.

Dans le cas où la transformation articulatori-acoustique est linéaire, l’agent aligne

progres-sivement ses productions sur celles du maître : on passe, dans l’exemple présenté sur la figure

4.7 de µ

Mo

≈ −2.5 et µ

Mo+

≈ 8 au début de l’apprentissage à µ

Mo

= −5 et µ

Mo+

= 5 après

convergence. Ce sont en effet les seules valeurs qui peuvent permettre de bien atteindre les

cibles données par le maître au cours de l’apprentissage. On observe donc que, même si l’agent

semble initialement avoir ancré des choix moteurs, la nécessité de devoir imiter le maître va

petit-à-petit l’amener à corriger ces choix.

Considérons maintenant les cas non-linéaires. Une transformation articulatori-acoustique

non-linéaire est caractérisée par l’existence de plateaux pour lesquels une variation de la consigne

motrice ne provoque que peu ou pas de variation de la conséquence acoustique. Dans ce cas

l’agent a donc un grand choix de gestes moteurs permettant d’atteindre une cible. En ce

sens, une transformation articulatori-acoustique non-linéaire gomme dans l’espace acoustique

des différences présentes dans l’espace moteur.

Dans ce cadre, le mécanisme d’ancrage dans les répertoires moteurs des premiers choix de

gestes à associer aux objets au début de l’apprentissage permet à l’agent de développer des

idiosyncrasies. En effet, alors que pour atteindre une cible correspondant à l’objet o l’agent a

initialement un grand nombre de gestes moteurs parmi lesquels il peut choisir, à chaque fois

que l’agent choisit un geste m, il met à jour le prototype moteur correspondant à l’objet o en

conséquence, ce qui a pour effet d’augmenter la probabilité que ce gestemsoit associé à nouveau

à l’objet olors d’une étape future de l’apprentissage.

C’est ce qu’illustre par exemple le cas fortement non-linéaire présenté sur la figure 4.7 :

au début de l’apprentissage on a les mêmes valeurs µ

Mo

≈ −2 et µ

Mo+

≈ 10 qu’à la fin de

l’apprentissage. Les choix faits initialement, qui permettaient d’atteindre les cibles à imiter, se

sont renforcés, si bien que l’agent s’est construit des prototypes de gestes moteurs très différents

de ceux du maître (dont les moyennes sontµ

Mo

=−5 et µ

Mo+

= 5).

En revanche, dans le cas non-linéaire de la figure 4.7, les moyennes des prototypes moteurs

de l’agent passent deµ

Mo

≈ −3 etµ

Mo+

≈10 au début de l’aprentissage àµ

Mo

≈ −5 etµ

Mo+

≈10

après convergence. Alors que le prototype moteur que l’agent associe à l’objet o

+

a la même

moyenne au début et à la fin de l’apprentissage, celui correspondant à l’objeto

voit sa moyenne

changer. La raison en est qu’au début de l’apprentissage l’agent associe dans ses répertoires

moteurs P(M | [O

S

=o

] π

Ag

) une probabilité non négligeable à des gestes moteurs M > 0.

De tels gestes, dont l’image par la fonction sigmoïde non-linéaire sera très éloignée de la cible

donnée par le maître, ont donc une probabilité très élevée de ne pas être choisis pour la tâche

d’imitation. Du coup, le mécanisme d’ancrage aura pour effet de diminuer progressivement le

poids relatif de ces gestes qui sont de mauvais candidats en augmentant le poids des autres, ce

qui a pour effet de décaler progressivement la moyenne µ

Mo

de −3 vers−5. Cela montre que

l’ancrage des idosyncrasies grâce au mécanisme de renforcement que nous avons proposé ne se

fait pas au détriment de la capacité à atteindre les cibles proposées par le maître.

On peut donc résumer le comportement de notre algorithme d’apprentissage par

accomoda-tion à deux idées simples :

• L’accumulation de connaissances grâce au paradigme d’imitation permet de choisir des

gestes permettant d’atteindre les cibles proposées par le maître.

• Si, comme c’est le cas lorsque la transformation articulatori-acoustique est non-linéaire, il

y a plusieurs candidats de gestes moteurs permettant d’atteindre aussi bien les cibles, il

n’y a alors rien qui pousse l’agent à converger vers les mêmes prototypes de gestes moteurs

que ceux du maître. Dans ce cas, l’agent privilégie les gestes qu’il a déjà choisis par le

passé, et ancre ainsi des choix idiosyncrasiques.

4 Comparaisons au sein de COSMO des prédictions des

théories motrice, auditive et perceptuo-motrice de la

perception

Dans la section précédente nous avons décrit des algorithmes permettant d’apprendre grâce

aux mêmes données (les couples < s, o > associant objets et entrées perceptives fournis par

l’agent maître) les paramètres du système perceptif, ceux du sytème sensori-moteur, et ceux

du système moteur. Il s’agit maintenant d’évaluer comparativement les modèles auditif,

mo-teur et perceptuo-momo-teur de la perception, et de tester leur robustesse aux conditions adverses

en comparant leurs performances respectives en fonction du niveau de dégradation du signal

dans l’environnement au moment du test. Pour cela, nous commençons par nous assurer que

l’algorithme d’apprentissage par accomodation que nous avons mis en place nous a bien permis

de nous écarter des hypothèses de notre théorème d’indistinguabilité.