Description de l’apprentissage de COSMO

3.2 Comment se développent les invariants des unités distinctives ?

_S^{M aitre}

_S^{M aitre}

_S^{M aitre}

L. Pour ne pas alourdir les calculs, nous ne les exprimons pas.

_S^{M aitre}

L, ce qui correspond à l’apprentissage du classifieur sensoriel

L, correspond

3.2 Comment se développent les invariants des unités distinctives ?

4.2.3 Description de l’apprentissage de COSMO

Dans cette partie, nous décrivons les étapes de l’apprentissage sans nous focaliser sur la nature

des distributions. Comme nous l’avons fait dans la section précédente, nous préférons pour le moment

nous focaliser sur les mécanismes et les différentes phases de l’apprentissage. Comme précédemment,

nous nous concentrons sur l’apprentissage de COSMO générique.

Dans le modèle COSMO, l’apprentissage se fait en trois temps. Dans un premier temps, nous

réalisons un apprentissage sensoriel qui, comme nous l’avons supposé pour le développement du

bébé et comme nous l’avons vu dans les modèles de développement, correspond à l’acquisition des

représentations sensorielles. Ensuite, nous séparons l’apprentissage moteur en deux temps avec, d’une

part, un apprentissage sensorimoteur dans lequel l’agent apprend son modèle interne et, d’autre part,

un apprentissage moteur dans lequel l’agent apprend ses représentations motrices. Cela correspond

aux deux phases que nous avons relevées précédemment dans les modèles de développement. Nous

préférons les distinguer et les présenter à part dans notre modèle.

L’apprentissage de COSMO étant essentiellement un apprentissage social, nous commençons par

présenter dans cette section comment les signaux de l’environnement sont fournis à l’agent apprenant.

Ensuite, nous détaillons successivement les trois étapes d’apprentissage du modèle.

4.2.3.1 La présence d’un maître

Précédemment, nous avons vu que l’apprentissage du bébé est modulé par l’environnement. Plus

exactement, les processus d’acquisition de perception et de production du bébé sont influencés par les

signaux de son environnement (voir section 3.2.2), ce qui permet au bébé d’apprendre à percevoir et

produire principalement les unités phonétiques spécifiques à sa langue. C’est pourquoi, il est important

que notre agent puisse recevoir, durant son apprentissage, des signaux caractéristiques d’une langue

donnée ou, au moins, les signaux des catégories phonétiques que nous souhaitons lui faire apprendre.

Pour cela, « l’environnement » correspond dans notre modèle à un agent COSMO particulier,

nommé maître. Pour le distinguer de l’agent apprenant, ses distributions sont notées avec la mention

M aitreen exposant. Par exemple le prior catégoriel moteurP(O

)s’écrit pour le maîtreP(O

).

Néanmoins, cela ne change en rien la nature des distributions et il reste un agent COSMO, comme

l’agent apprenant. Cet agent maître peut s’apparenter à une personne sachant déjà communiquer :

un tuteur, un parent, un membre de la famille, etc. Pour simplifier notre processus d’apprentissage,

nous n’utilisons, dans nos études, qu’un unique agent maître que nous supposons commun à chaque

simulation. L’agent maître possède des distributions de mêmes formes et de même nature qu’un agent

apprenant. La seule différence est que les distributions du maître sont déjà configurées (le processus

de développement est supposé déjà avoir eu lieu pour le maître à une étape préalable), contrairement

à celles de l’agent.

Durant chaque étape de l’apprentissage, cet agent maître est chargé de fournir à l’agent

appre-nant des données de parole lui permettant d’apprendre ses distributions. Ce sont ces données qui

permettront à l’agent apprenant de mettre à jour ses distributions de manière à apprendre les unités

distinctives de son maître. Afin d’éviter des biais d’apprentissage associés à la caractérisation des

si-gnaux acoustiques, nous décidons que l’agent est parfaitement capable d’entendre son maître et que

les productions des deux agents sont préalablement normalisées, c’est-à-dire ramenés à un triangle

vocalique de référence. De plus, nous supposons que l’agent est capable de segmenter parfaitement

les signaux et qu’il les traite les uns après les autres. Cela évite tous les problèmes inhérents à la

segmentation du signal, qui ne font pas partie du programme de cette thèse.

L’apprentissage est découpé en pas d’apprentissage pendant lesquels le maître fournit une donnée

sensorielle à l’agent. Cela permet d’avoir un apprentissage itératif, ce que nous supposons primordial

pour l’apprentissage phonétique. À chaque itération, la production du maître s’effectue de la manière

suivante : le maître choisit un objetoà communiquer grâce à son prior catégoriel moteurP(O

).

Ensuite, il utilise son répertoire moteurP(M

|[O

=o])grâce auquel il tire une

repré-sentation motricem correspondant à cet objet o, puis la produit. Cette production est transformée

dans l’environnement et perçue par l’agent apprenant sous forme de signal auditif. Nous modélisons

cette transformation également par une distribution de probabilitéP(S

|M

), ce qui nous

per-met de faire varier la qualité du signal. Par exemple, cela nous perper-met de modéliser un signal bruité.

En termes de correspondance, nous considérons actuellement dans le modèle que les représentations

motricesM

sont équivalentes à la réalisation des gestes moteursM

produits dans

l’environ-nement. De la même manière, le signal auditifS

est dans notre modèle directement perçu comme

une représentation sensorielleSsans traitement acoustique ou auditif préalable par l’agent apprenant.

Ceci est illustré Fig. 4.9. Il s’agit bien entendu de simplifications. Plus techniquement, cela suppose

qu’il existe deux variables et deux systèmes de cohérence pour assurer respectivement l’équivalence

entreM

etM

et entreS etS

, comme il en existe un pour assurer l’équivalence entre

O

etO

FIGURE 4.9 – Illustration de la production d’un son dans l’environnement par le maître. Les

distri-butions non détaillées du maître sont notées en pointillés. Les équivalences entre les variablesM et

M

d’une part etSetS

|S) = _P^P^(O

⁾^P(S^|^O

⁾

P(OL)P(S|OL) ^. (4.4)