Nous avons décrit et analysé l’apprentissage de l’agent. En fin d’apprentissage, l’agent semble
conserver un certain nombre de noyaux lui permettant de représenter la distribution des stimuli de
l’environnement. Si certains de ces noyaux semblent correspondre aux catégories phonétiques du
maître, comme les voyelles, ceci reste moins clair pour les consonnes et les syllabes. Puisque rien,
dans l’apprentissage, ne permet à l’agent apprenant de converger vers un code identique à celui du
maître, nous ne pouvons espérer « voir » apparaitre explicitement les phonèmes ou les syllabes dans
les distributions apprises. En revanche, même si l’agent converge vers un codage différent de celui du
maitre, cela ne l’empêche pas forcément de résoudre des tâches de communication. Nous vérifions
donc dans cette section que le maître et l’agent peuvent communiquer.
7.4.1 Communication via la branche sensorielle
Sachant que l’agent n’a pas les mêmes objets que le maître, il est difficile de vérifier qu’ils se
comprennent de façon directe. Dans la branche sensorielle, un des moyens d’analyser cette
commu-nication est d’inférer le noyau correspondant à une catégorie phonétique prononcée par le maître, de
générer un signal avec le noyau choisi et de vérifier que le signal résultant est bien compris par le
maître comme appartenant à la même catégorie que celle qu’il avait sélectionnée initialement. Dans
la suite, nous appellons « retranscription » l’ensemble de cette boucle maître, agent, maître.
En termes computationnels, cela consiste à calculer la matrice de confusionP(O
R|O
E)oùO
E(E pour « Envoyé ») correspond à la catégorie phonétique envoyée par le maître
2etO
R(R pour
« Reçu ») à l’objet interprété, en fin de boucle, par le maître. En supposantS, la notation générique
pour les représentations sensorielles etNLcelle pour les noyaux de l’agent, cette distribution se
cule par :
P(O
R|O
E)
∝ X
SR,SE,NL
P(O
R|S
R)P(S
R|N
L)P(N
L|S
E)P(S
E|O
E). (7.18)
Dans cette équation,P(S
R|NL) correspond à un des répertoires auditifs de l’agent apprenant
(respectivement vocalique, consonantique et syllabique) etP(N
L|S
E)se calcule de la même
ma-nière qu’aux Eq. 7.6 (vocalique), 7.7 (consonantique) et 7.8 (syllabique). Les matrices observées sont
représentées Fig. 7.13 pour les phonèmes et Fig. 7.14 pour les syllabes. Nous calculons pour chacune
d’elle une mesure de performance, traduisant les situations de communication correcte, c’est-à-dire
où le maitre reconnaît le même objet qu’il avait fourni initialement. Cela correspond à la moyenne des
valeurs de la diagonale de la matrice.
(a) Voyelles, performance = 0.90 (b) Consonnes, performance = 0.60
FIGURE7.13 – Illustration des matrices de confusion phonémiques. Seules les valeurs au dessus de
0,01 sont notées
En ce qui concerne les phonèmes (Fig. 7.13), nous remarquons que le maître, après « rebond
sur l’agent », reconnaît globalement très bien les voyelles (score de performance supérieur à 0,90).
Néanmoins, les voyelles [e] et [E] se confondent parfois. Cela signifie que globalement les noyaux de
l’agent correspondent à une unique voyelle, ce qui est conforme à l’observation réalisée sur les noyaux
vocaliques (voir Fig. 7.7d et Fig. 7.5 pour comparaison). Outre le fait que les noyaux vocaliques les
plus représentatifs sont très séparables dans l’espace sensoriel, nous avons vu que les distributions
gaussiennes associées semblent avoir une petite variance. Il est donc possible que l’agent choisisse un
mauvais noyau lorsque le maître fournit à l’agent des données sensorielles éloignées des prototypes
des catégories, ce qui donne une mauvaise retranscription.
De leur côté, les consonnes sont moins bien retranscrites que les voyelles (performance globale
de 0,60). Même si les bonnes consonnes sont le plus souvent reconnues (la probabilité du hasard est
de 0,33), il y a de nombreuses confusions. Cela s’explique par le fait que les noyaux consonantiques
de l’agent, bien qu’ils décrivent correctement la distribution globale de l’environnement, ne sont pas
toujours associés à une unique catégorie consonantique (voir Fig. 7.7a et Fig. 7.5 pour comparaison).
En ce qui concerne les syllabes (Fig. 7.14), nous remarquons qu’elles sont globalement moins
(a) Syllabes CV, performance = 0.73
(b) C, performance = 0.76
(c) V, performance = 0.96
FIGURE7.14 – Illustration des matrices de confusion syllabiques globales (gauche) et regroupées par
consonnes (droite, haut) ou par voyelles (droite, bas). Seules les valeurs au dessus de 0,01 sont notées
bien retranscrites que les voyelles mais mieux retranscrites que les consonnes. Néanmoins, après
re-groupement par phonèmes (consonnes d’une part et voyelles d’autre part), nous remarquons que la
performance syllabique est plus élevée que la performance phonémique (score de 0,76 au lieu de 0,60
pour les consonnes et score de 0,96 au lieu de 0,90 pour les voyelles). Ainsi, l’apprentissage
sylla-bique, apprenant les consonnes et les voyelles de manière conjointe, dans un même espace, semble
conduire à de meilleures performances.
7.4.2 Communication via la branche motrice
Nous souhaitons vérifier la communication de l’agent avec le maître également dans la branche
motrice. Une retranscription telle que celle effectuée pour la branche sensorielle demande d’inférer
les noyaux moteurs correspondant aux sons du maître et de les reproduire. La production des noyaux
pose quelques problèmes, notamment dans le cas consonantique. En effet, même si nous inférons un
invariant consonantique, celui-ci ne peut être produit dans l’espace sensoriel sans voyelle associée. Or,
les essais réalisés montrent que la voyelle est primordiale lors de la retranscription et que l’utilisation
d’une voyelle aléatoire (par exemple, celle envoyée par le maître) produit de mauvaises transcriptions
consonantiques. De ce fait, nous ne passons pas, cette fois-ci, par un système de retranscription et
nous comparons directement les catégories du maître avec les noyaux de l’agent. Les matrices
corres-pondantes sont illustrées Fig. 7.15 pour les phonèmes et Fig. 7.16 pour les syllabes.
(a) Voyelles (b) Consonnes
FIGURE7.15 – Illustration des matrices maîtres/agents phonémiques : voyelles (gauche) et consonnes
(droite). Les couleurs vont du marron (forte probabilité) au bleu foncé (faible probabilité, inférieure
à 0,01). Les noyaux sont triés selon leur probabilité, pour chaque catégorie phonétique, de gauche à
droite
De manière générale, nous remarquons que les catégories phonétiques sont toutes représentées
par plusieurs noyaux. Cependant, nous notons également que tous les noyaux ne sont pas associés
à des catégories phonétiques spécifiques : certains ont des probabilités faibles pour l’ensembles des
catégories.
Focalisons-nous sur les phonèmes (Fig.7.15). Du côté des voyelles, nous observons que chaque
catégorie phonétique est associée à un groupe de noyaux spécifique, sauf les catégories [u] et [o]
qui semblent utiliser des noyaux communs. Cela suggère que malgré quelques confusions, l’agent
arrive à la capacité d’apprendre les catégories vocaliques et de communiquer avec lui. Du côté des
consonnes, le comportement des noyaux est assez diversifié. Si certains noyaux semblent être utilisé
pour caractériser l’ensemble des plosives, d’autres sont plus spécifiques à une catégorie consonantique
particulière. Ainsi, même si certains noyaux sont communs à plusieurs catégories, chaque consonne
semble avoir des noyaux qui lui sont spécifiques. Du fait de ces différents types de noyaux, savoir
si l’agent peut communiquer avec son maître n’est pas clairement décidable. De plus, les consonnes
n’étant pas prononçables de façon isolée, il faudrait vérifier si les noyaux permettent de produire
différentes voyelles.
Passons maintenant aux syllabes (Fig. 7.16). Nous présentons d’abord les syllabes dans leur
en-semble avant de les regrouper par voyelles et par consonnes. Nous remarquons, comme pour les
phonèmes, que si certaines syllabes ont des catégories qui leurs sont propres, d’autres sont partagées
entre plusieurs catégories (voir les portions entourées en jaune). Par exemple, le noyau 30 est partagé
entre [bu] et [gu], ce qui est cohérent avec la proximité acoustique de ces deux catégories de syllabes.
En regroupant par phonèmes les unités syllabiques, nous observons que les noyaux semblent
da-vantage correspondre à une unique catégorie pour les consonnes que dans le modèle phonémique. En
(a) Syllabes CV (b) Consonnes C (c) Voyelles V
FIGURE7.16 – Illustration des matrices maîtres/agents syllabiques (gauche), regroupées par
conson-nes (milieu) et regroupées par voyelles (droite). Les couleurs vont du marron (forte probabilité) au
bleu foncé (faible probabilité, inférieure à 0.01). Les noyaux ont été triés selon leur probabilité pour
chaque catégorie phonétique, de gauche à droite
revanche, il apparaît davantage de confusion pour les voyelles : les mêmes noyaux sont utilisés pour
les voyelles [o] et [O] ainsi que pour les voyelles [e] et [E]. Ces mélanges risque de se ressentir dans la
communication.
7.5 Discussion générale
Dans le document
Modélisation bayésienne du développement conjoint de la perception, l'action et la phonologie
(Page 177-181)