• Aucun résultat trouvé

Nous avons décrit et analysé l’apprentissage de l’agent. En fin d’apprentissage, l’agent semble

conserver un certain nombre de noyaux lui permettant de représenter la distribution des stimuli de

l’environnement. Si certains de ces noyaux semblent correspondre aux catégories phonétiques du

maître, comme les voyelles, ceci reste moins clair pour les consonnes et les syllabes. Puisque rien,

dans l’apprentissage, ne permet à l’agent apprenant de converger vers un code identique à celui du

maître, nous ne pouvons espérer « voir » apparaitre explicitement les phonèmes ou les syllabes dans

les distributions apprises. En revanche, même si l’agent converge vers un codage différent de celui du

maitre, cela ne l’empêche pas forcément de résoudre des tâches de communication. Nous vérifions

donc dans cette section que le maître et l’agent peuvent communiquer.

7.4.1 Communication via la branche sensorielle

Sachant que l’agent n’a pas les mêmes objets que le maître, il est difficile de vérifier qu’ils se

comprennent de façon directe. Dans la branche sensorielle, un des moyens d’analyser cette

commu-nication est d’inférer le noyau correspondant à une catégorie phonétique prononcée par le maître, de

générer un signal avec le noyau choisi et de vérifier que le signal résultant est bien compris par le

maître comme appartenant à la même catégorie que celle qu’il avait sélectionnée initialement. Dans

la suite, nous appellons « retranscription » l’ensemble de cette boucle maître, agent, maître.

En termes computationnels, cela consiste à calculer la matrice de confusionP(O

R

|O

E

)oùO

E

(E pour « Envoyé ») correspond à la catégorie phonétique envoyée par le maître

2

etO

R

(R pour

« Reçu ») à l’objet interprété, en fin de boucle, par le maître. En supposantS, la notation générique

pour les représentations sensorielles etNLcelle pour les noyaux de l’agent, cette distribution se

cule par :

P(O

R

|O

E

)

X

SR,SE,NL

P(O

R

|S

R

)P(S

R

|N

L

)P(N

L

|S

E

)P(S

E

|O

E

). (7.18)

Dans cette équation,P(S

R

|NL) correspond à un des répertoires auditifs de l’agent apprenant

(respectivement vocalique, consonantique et syllabique) etP(N

L

|S

E

)se calcule de la même

ma-nière qu’aux Eq. 7.6 (vocalique), 7.7 (consonantique) et 7.8 (syllabique). Les matrices observées sont

représentées Fig. 7.13 pour les phonèmes et Fig. 7.14 pour les syllabes. Nous calculons pour chacune

d’elle une mesure de performance, traduisant les situations de communication correcte, c’est-à-dire

où le maitre reconnaît le même objet qu’il avait fourni initialement. Cela correspond à la moyenne des

valeurs de la diagonale de la matrice.

(a) Voyelles, performance = 0.90 (b) Consonnes, performance = 0.60

FIGURE7.13 – Illustration des matrices de confusion phonémiques. Seules les valeurs au dessus de

0,01 sont notées

En ce qui concerne les phonèmes (Fig. 7.13), nous remarquons que le maître, après « rebond

sur l’agent », reconnaît globalement très bien les voyelles (score de performance supérieur à 0,90).

Néanmoins, les voyelles [e] et [E] se confondent parfois. Cela signifie que globalement les noyaux de

l’agent correspondent à une unique voyelle, ce qui est conforme à l’observation réalisée sur les noyaux

vocaliques (voir Fig. 7.7d et Fig. 7.5 pour comparaison). Outre le fait que les noyaux vocaliques les

plus représentatifs sont très séparables dans l’espace sensoriel, nous avons vu que les distributions

gaussiennes associées semblent avoir une petite variance. Il est donc possible que l’agent choisisse un

mauvais noyau lorsque le maître fournit à l’agent des données sensorielles éloignées des prototypes

des catégories, ce qui donne une mauvaise retranscription.

De leur côté, les consonnes sont moins bien retranscrites que les voyelles (performance globale

de 0,60). Même si les bonnes consonnes sont le plus souvent reconnues (la probabilité du hasard est

de 0,33), il y a de nombreuses confusions. Cela s’explique par le fait que les noyaux consonantiques

de l’agent, bien qu’ils décrivent correctement la distribution globale de l’environnement, ne sont pas

toujours associés à une unique catégorie consonantique (voir Fig. 7.7a et Fig. 7.5 pour comparaison).

En ce qui concerne les syllabes (Fig. 7.14), nous remarquons qu’elles sont globalement moins

(a) Syllabes CV, performance = 0.73

(b) C, performance = 0.76

(c) V, performance = 0.96

FIGURE7.14 – Illustration des matrices de confusion syllabiques globales (gauche) et regroupées par

consonnes (droite, haut) ou par voyelles (droite, bas). Seules les valeurs au dessus de 0,01 sont notées

bien retranscrites que les voyelles mais mieux retranscrites que les consonnes. Néanmoins, après

re-groupement par phonèmes (consonnes d’une part et voyelles d’autre part), nous remarquons que la

performance syllabique est plus élevée que la performance phonémique (score de 0,76 au lieu de 0,60

pour les consonnes et score de 0,96 au lieu de 0,90 pour les voyelles). Ainsi, l’apprentissage

sylla-bique, apprenant les consonnes et les voyelles de manière conjointe, dans un même espace, semble

conduire à de meilleures performances.

7.4.2 Communication via la branche motrice

Nous souhaitons vérifier la communication de l’agent avec le maître également dans la branche

motrice. Une retranscription telle que celle effectuée pour la branche sensorielle demande d’inférer

les noyaux moteurs correspondant aux sons du maître et de les reproduire. La production des noyaux

pose quelques problèmes, notamment dans le cas consonantique. En effet, même si nous inférons un

invariant consonantique, celui-ci ne peut être produit dans l’espace sensoriel sans voyelle associée. Or,

les essais réalisés montrent que la voyelle est primordiale lors de la retranscription et que l’utilisation

d’une voyelle aléatoire (par exemple, celle envoyée par le maître) produit de mauvaises transcriptions

consonantiques. De ce fait, nous ne passons pas, cette fois-ci, par un système de retranscription et

nous comparons directement les catégories du maître avec les noyaux de l’agent. Les matrices

corres-pondantes sont illustrées Fig. 7.15 pour les phonèmes et Fig. 7.16 pour les syllabes.

(a) Voyelles (b) Consonnes

FIGURE7.15 – Illustration des matrices maîtres/agents phonémiques : voyelles (gauche) et consonnes

(droite). Les couleurs vont du marron (forte probabilité) au bleu foncé (faible probabilité, inférieure

à 0,01). Les noyaux sont triés selon leur probabilité, pour chaque catégorie phonétique, de gauche à

droite

De manière générale, nous remarquons que les catégories phonétiques sont toutes représentées

par plusieurs noyaux. Cependant, nous notons également que tous les noyaux ne sont pas associés

à des catégories phonétiques spécifiques : certains ont des probabilités faibles pour l’ensembles des

catégories.

Focalisons-nous sur les phonèmes (Fig.7.15). Du côté des voyelles, nous observons que chaque

catégorie phonétique est associée à un groupe de noyaux spécifique, sauf les catégories [u] et [o]

qui semblent utiliser des noyaux communs. Cela suggère que malgré quelques confusions, l’agent

arrive à la capacité d’apprendre les catégories vocaliques et de communiquer avec lui. Du côté des

consonnes, le comportement des noyaux est assez diversifié. Si certains noyaux semblent être utilisé

pour caractériser l’ensemble des plosives, d’autres sont plus spécifiques à une catégorie consonantique

particulière. Ainsi, même si certains noyaux sont communs à plusieurs catégories, chaque consonne

semble avoir des noyaux qui lui sont spécifiques. Du fait de ces différents types de noyaux, savoir

si l’agent peut communiquer avec son maître n’est pas clairement décidable. De plus, les consonnes

n’étant pas prononçables de façon isolée, il faudrait vérifier si les noyaux permettent de produire

différentes voyelles.

Passons maintenant aux syllabes (Fig. 7.16). Nous présentons d’abord les syllabes dans leur

en-semble avant de les regrouper par voyelles et par consonnes. Nous remarquons, comme pour les

phonèmes, que si certaines syllabes ont des catégories qui leurs sont propres, d’autres sont partagées

entre plusieurs catégories (voir les portions entourées en jaune). Par exemple, le noyau 30 est partagé

entre [bu] et [gu], ce qui est cohérent avec la proximité acoustique de ces deux catégories de syllabes.

En regroupant par phonèmes les unités syllabiques, nous observons que les noyaux semblent

da-vantage correspondre à une unique catégorie pour les consonnes que dans le modèle phonémique. En

(a) Syllabes CV (b) Consonnes C (c) Voyelles V

FIGURE7.16 – Illustration des matrices maîtres/agents syllabiques (gauche), regroupées par

conson-nes (milieu) et regroupées par voyelles (droite). Les couleurs vont du marron (forte probabilité) au

bleu foncé (faible probabilité, inférieure à 0.01). Les noyaux ont été triés selon leur probabilité pour

chaque catégorie phonétique, de gauche à droite

revanche, il apparaît davantage de confusion pour les voyelles : les mêmes noyaux sont utilisés pour

les voyelles [o] et [O] ainsi que pour les voyelles [e] et [E]. Ces mélanges risque de se ressentir dans la

communication.

7.5 Discussion générale