5.2 L'utilité des systèmes articiels
6.1.2 Pré-supposition 2 : T raduction entre l'espace perceptuel
per-ceptuel et l'espace des relations entre organes, et
traduction entre l'espace desrelations entre organes
et l'espace des activations musculaires.
Comme nous l'avons déjà dit plus haut, nous pré-supposons qu'un agent
étantdonné unsignalacoustique,qui est unetrajectoirecontinue,est capable
deretrouverlatrajectoirederelationsentreorganescorrespondante(c'est-à-dire
qui apermis deproduire leson). Au contraire,initialementles agentsne sont
pas capablesde retrouverles objectifs articulatoires qui ont serviàconstruire
latrajectoirederelations entre organes.Noussupposons aussiqu'étantdonné
une suite d'objectifs articulatoires dans l'espace des relations entre organes,
lesagentssontcapablesdetrouverunetrajectoiredansl'espacedesactivations
Fig.6.2 Lafonctiond'activationgaussienneutiliséepardéfautdanslessimulations
est celle avec
σ 2 = 0.001
. Ellen'est pastrès spécique: ellepermet auxneurones derépondre signicativementsuràpeuprès10pourcentde l'espaced'entrée.
atteints.
56
.
Celavanouspermettreden'utiliser queleniveaudereprésentation
concer-nantlesrelationsentreorganesetdoncunevisualisationetunecompréhension
plus intuitive. Si nous avions utilisé lestrois représentations, comme
schéma-tisésurlagure6.3, nousaurionseutroiscartesnerveuses,chacunecomposée
d'unitésnerveusescodantunespace.Ilyauraitunecartenerveuseperceptuelle,
composéedeneuronesquirecevraientleursentréesdel'activationdelacochlée.
Ces entréespourraientêtredes formantsparexemple. Ensuite, il yaurait des
unitésnerveusesdansuncartedesrelationsentreorganes,quirecevraientleur
entrées des activations des neurones dans la carte perceptuelle. La troisième
cartenerveuseseraitcomposéed'unités nerveusescodantpourl'espacedes
ac-5.Lafonctionquifaitcorrespondrel'espacedesrelationsentreorganesàl'espacedes
acti-vationsmusculairesn'estpasunisomorphisme:unobjectifdansl'espacedesrelationsentre
organespeutêtreréalisésouventparplusieursorganesoucombinaisonsd'organes.Nous
sup-posonsqu'aumoinsunepossibilitépeutêtretrouvée.Commentlechoixentreplusieurs
pos-sibilitéspeutêtrefaitaétédécritdanslalittérature(Baillyetal.,1997).
6.Notez que cela veut dire que les agents ont le savoir-faire pour copier un son qu'ils
entendent, maiscelaneveut pas direqu'ilslefont. Enfait,commenous l'expliquerons,les
agents necopient jamais(n'imitentjamais)un son qu'ilsviennent d'entendre.Doncils ne
s'imitentpas et nous évitons la question Pourquoi s'imitent-ils?.Nous décrirons dans le
chapitre suivantcommentcetypedetraduction,que noussupposonsici,peut êtreapprises
Fig.6.3 Sinousavionsutilisélestroisreprésentations,etn'avionspaspré-supposé
lacapacitéàpasserdel'uneàl'autre,l'architecturegénéraledusystèmeseraitcelle-ci.
tivations musculaires, et recevant sesentrées des activations des neurones de
lacartedesrelationsentreorganes.Ensuite,l'activationdesneuronesdecette
dernière carte serait utilisée pour contrôler les organes, ce qui produirait du
son. Techniquement,supposerquelesagentssontcapables depasserd'une
re-présentation àl'autre veut dire que les connections entre les cartesnerveuses
sont telles que quand un son active la cochlée et les neurones dans la carte
perceptuelle, alors les neurones dans la carte des relations entre organes qui
sontle plusactivésontleur vecteur préféréqui correspond àlarelation entre
organequi aproduit le son.En outre, lesneuronesde lacartedes activations
musculaires qui sont le plus activés ont leur vecteur préféréqui correspond à
lacongurationmusculairequiaproduitcetterelationentreorganes.Plusieurs
papiers ont montré comment ces connections pouvaient être apprise au cours
d'unbabillage(Bailly etal.,1997;Oudeyer,2003b).
Parce que nous utilisons uniquement l'espace des relations entre organes,
les unités nerveuses ont desentréesdirectementcodéesentermes de relations
entreorganes.Laproductiond'unevocalisation,programméeparuneséquence
d'activationsde plusieurs
n i
commenousl'expliquons plusbas,consisteseule-Fig.6.4 Nous utilisonsseulement le niveau de représentation des relationsentre
organes, puisque nous supposons que les agents sont capables de passer de l'espace
perceptuel à l'espace des relations entre organes, et de l'espace des relations entre
organesàceluidesactivationsmusculaires.
mentenlaformationd'unetrajectoirecontinuedansl'espacedesrelationsentre
organes.Lesagentsnes'échangentquecestrajectoires.Lagure6.4schématise
cettesimplication.
Ilyaaussiunmodulenoté inhibition/activation qui permet d'envoyerun
signalGO qui laisse une vocalisationêtre produite quand lesunités nerveuses
sontactivées.C'est-à-direqu'enl'absencedecesignal,lescommandesspéciées
parl'activation desunités nerveuses ne sontpas eectivement exécutées. Cela
veut dire que l'activation des
n i
par un son extérieur ne provoque pasdirec-tement lareproductiondece son. Lacopie nécessitelesignalGO.En fait, les
agents n'utilisent jamais ce signal GO quand ils viennent d'entendre un son,
mais seulement à des moments aléatoires, ce qui fait qu'ils ne copient pas ce
de haut niveau dans la trajectoire continue, et qui pourraient leur permettre
de trouver quels points correspondent aux objectifs articulatoires utilisés par
l'agentqui aproduit lavocalisation.Ilssegmententlatrajectoireen detoutes
petites parties, qui correspondent à la résolution temporelle de la perception
(si nous utilisions lestrois représentations, cela correspondraitàla résolution
temporelle de la cochlée). Ensuite, chacune de ces petites parties est
moyen-née 7
,cequidonneune valeurdansl'espacedesrelationsentreorganes,qui est
alorsenvoyéeauxunitésnerveuses.Cesunitésnerveusessontalorsactivées
sui-vantlaformule quel'on adonnéedansla sectionunités nerveuses.Lagure
6.5 schématise ce traitement.L'axe des abscissesreprésente le temps, et l'axe
des y représente l'espace des relationsentre organes.Ici l'espace des relations
entre organesest mono-dimensionnel.Laligne continuereprésente une
vocali-sation perçue parl'agent. Les petits segmentsqui lasectionnent représentent
lesmoyennesdespetitespartiesqueleltretemporel extrait.Cesvaleurssont
lesentréesdonnéesséquentiellementauxunitésnerveuses.Lesunitésnerveuses
decetagentsontreprésentéessurl'axedesordonnées:chaquepointcorrespond
à unvecteurpréféré. En eet, ces points sont àvaleurdans l'espace des
rela-tionsentreorganes.Chacunedecesunitésnerveusesestactivéeparchacunedes
moyennes.
Quandellessontactivées,lesunitésnerveusessontmodiées.Celaveutdire
queleursvecteurspréféréssontchangés.Cechangementest unesensibilisation
austimuluspourlesneuronesquiontrépondusignicativement.Celaimplique
que si le même stimulus est donné en entrée juste après, alorsla réponse des
unitésnerveusesserauntoutpetitpeuplusforte.Lechangementesttrèsfaible
àchaquefois, et pondéréparlesactivationsde chaqueuniténerveuse(quiest
une valeur entre 0 et 1). Les unités qui sont très actives changent plus que
les unitésqui nele sont pas.La gure6.6 illustre le changement desvecteurs
préférés. Cette gure représente la fonction d'activation d'une unité nerveuse
avantqu'elle ne reçoiveune entrée, et après qu'elle en ait reçuet traité une:
le vecteur préféré, c'est-à-direle centre de la gaussienne, a été déplacé. Nous
voyonsqued'unpointdevuegéométrique,levecteurpréféréesttranslatévers
lestimulus.
Laformulemathématique delanouvellefonctiond'activation est:
tune i,t+1 (s) = √ 2πσ 1 ∗ e v i,t+1 −s| 2 /σ 2
où
s
estlestimulus,etv i,t+1
levecteurpréféréden i
aprèsletraitementdes
:v i,t+1 = v i,t + 0.001 ∗ tune i,t (s) ∗ (s − v i,t )
6.1.4 Pré-supposition 4: Production
Laproductiond'unevocalisationconsisteàchoisiruneséquenced'objectifs
articulatoiresetàlesréaliser.Cesobjectifsarticulatoiressontspéciéspardes
relationsentreorganes,quisontmono-dimensionnellesdanslespremière
simula-tionsquenousallonseectuer.Pourchoisircesobjectifsarticulatoires,unagent
activeséquentiellement et aléatoirement des unités dans sa cartenerveuse, et
en mêmetemps envoie lesignalGO décrit plushaut.Cette activationest une
commande qui implémente le concept de geste dans cette thèse. Un objectif
Fig.6.5 Chaqueagentobtientune trajectoire continue(dansl'espacedesrelations
entre organes) quand il perçoit la vocalisation d'un autre agent. Il utilise alors un
ltrederésolutiontemporellequisegmentecettetrajectoireenuneséquencedeparties
trèscourtes.Pourchacune decesparties,oncalculelamoyenne,etlerésultatest un
stimulusquiest envoyéàlacartenerveuse, dontles unitéssontalorsactivées. Après
réceptiondechaque stimulusetactivationdesunités,celles-cisontmisesàjour.
système decontrôlequi exécuteces commandesenfaisantbougercontinûment
etséquentiellementlesrelationsentreorganesversl'objectif.
8
Sinousutilisions
les trois représentations,le système de contrôle activerait les musclesde telle
manièrequelesorganesseraientbougésversdes congurationssatisfaisantles
spécicationsde relations entre organes. Ici, lesystème de contrôle génère
di-rectementunetrajectoirecontinuedansl'espacedesrelationsentreorganesqui
passe par lesobjectifs. Cela est réalisé dans cette thèse par simple
interpola-8.Notezque cette manièredeproduire desvocalisations contient déjàdu discret. Nous
supposonsqueles vocalisationssont spéciéespar unesuited'objectifs.Ceciest enfaiten
accordaveclalittérature surlecontrôle moteurdesmammifères(Kandel etal., 2001),qui
le décrit comme étant organisé en deux niveaux: un niveau de commandes discrètes (nos
objectifsarticulatoires),etunniveauquis'occupedeleurexécution.Donclediscretquiest
présentdanslescommandesdiscrètesnedevraitpasêtreuntraitqu'ilfautexpliquerdansle
contextedesrecherchessurlesoriginesdelaparolepuisqu'ilestdéjàprésentdansl'architecture
decontrôlemoteur desmammifères.Cependant, nous nesupposonspasqu'initialementces
objectifs articulatoires sont organisés:l'ensemble des commandes utilisées pour dénir les
objectifs est un continuum, et iln'y a pas deré-utilisationd'objectifsarticulatoires d'une
vocalisation àl'autre; ladigitalité etlacompositionalitéseront unrésultatdessimulations.
Aussi,nous nesupposonspas qu'il ya dudiscretau niveaudela perception initialement,
dans le sensoù initialementlesagents nesontpas capables depercevoir desévènements
dans leuxsonore (cependant, àlanilserapossibled'identierlescatégories d'objectifs
f l (niveau d’activation de l’unité n )
i
Fig. 6.6 La mise à jour de chaque unité quand elle est activée par un stimulus
est tellequelevecteur préféré est changédemanière àceque l'unitérépondeunpeu
plus encore si l'on lui présentait de nouveau et juste après lemême stimulus. C'est
unesensibilisation desunités,quiest d'autantplusfortequandles neuronessonttrès
activés,etd'autantplusfaiblequandilssont peuactivés.
tion par des splines,c'est-à-dire par interpolation polynomiale (onpeut aussi
utiliser simplement des interpolations linéaires,qui ne modient en rien ni le
fonctionnementnilesrésultatsdessimulations).Lagure6.7schématisece
pro-cessusdeproduction.Surcettegure,l'axedesabscissesreprésenteletemps,et
l'axedesordonnéesreprésentel'espacedesrelationsentreorganes.Surl'axedes
ordonnées, on représente aussiles vecteurs préférésdes unités nerveuses de la
carted'unagent.Cinq decesunités sontactivéesséquentiellement,dénissant
les cinq objectifs articulatoires. Ensuite, lesystème de contrôle (interpolation
polynomiale)génèreunetrajectoirecontinuequipassepartouscespoints.Cette
trajectoireestlavocalisationqui seraperçueparlesagentsquil'entendront.
Le point crucial de cette pré-supposition est que les unités nerveuses
n i
sont utiliséesà lafois dans leprocessus de perception et dans le processus de
production.Enconséquence,ladistributiondesobjectifsarticulatoiresquisont
utilisésdanslaproductionestlamêmequecelledesvecteurspréférés,qui
eux-Fig.6.7 Quandunagentproduitunevocalisation,plusieursobjectifsarticulatoires
sont spéciés par l'activation séquentielle aléatoire d'unités nerveuses. Les vecteurs
préférésdecesunitésnerveusesdénissentlesrelationsentreorganesquidoiventêtre
atteintes à destemps donnés.Cesactivations sontdes commandes quisont appelées
gestes enphonologiearticulatoire.Ensuite,unsystème de contrôleconstruitune
tra-jectoire continue quipassepartousles objectifsarticulatoires.
Cela implique quesi unagententend certainssonsplus souventqued'autres,
il aura tendance àlesproduire aussiplus souventqueles autres(ici, unson
désigneune des petites parties desvocalisationsrésultantdupassage dultre
temporel décrit plus haut). Notez que cela n'est pas réalisé par un processus
d'imitation, mais c'estuneet debordde l'augmentation delasensibilité des
neurones, qui est unmécanisme trèsgénérique de dynamique nerveusede bas
niveau(Kandeletal.,2001).
6.1.5 Pré-supposition5:Distributioninitialedes vecteurs
préférés
Lesvecteurspréférésdesunitésnerveusessontpardéfautinitialement
aléa-toiresselonunedistributionuniformedans laversiondebase dusystème. Une
distributionuniformeveutdirequ'ilyadesvecteurspréférésdanstoutl'espace
duisentdesvocalisationscomposéesd'objectifsarticulatoiresquisontdistribués
uniformémentsurtoutl'espace.Celaimpliquequ'initialementlecontinuumdes
gestes possibles est utilisé (donc il n'y a pas de digitalité), et parce qu'il y a
beaucoupdeneuronesrépartisdanstoutl'espace,laré-utilisationdesobjectifs
articulatoiresest trèsrareetdueauhasard(donciln'yapasde
compositiona-lité).Aussi,l'activation globaledelacartenerveuseesten amplitudelamême
quelquesoitlestimulus.
Cette pré-supposition sera modiée dans la version biaisée du système,
danslaquelleladistributioninitialedesvecteurspréférésneseraplusuniforme.
Une distribution biaisée veut dire qu'elle n'est pas symétrique: initialement,
certaines parties de l'espace des relations entre organescontiendront plus de
vecteurspréférésqued'autresparties.Cebiaispermetdeprendreencompteles
contraintesduesàlafonctionquifaitcorrespondredessonsàdescongurations
articulatoires.Une distribution uniformerevientàsupposer quecette fonction
estlinéaireetsymétrique.Unedistributionbiaiséeprendencomptelespossibles
non-linéarités.
En eet,si l'on regardele conduit vocal humain, il ya desrelations entre
organespourlesquellesunpetitchangementproduit unpetit changementdans
le son, mais il y a aussi des relations entre organes pour lesquelles un petit
changementproduit un grand changement dans le son. Si nous utilisions une
architecturecommecelle dela gure6.3,dans laquelle lesunitésnerveuses de
la cartedes relationsentre organes sont activées par les neuronesde la carte
perceptuelle,celaveutdirequ'ilyacertainssonsquiactiventsignicativement
des unités nerveuses de la carte des relations entre organesdont les vecteurs
préférés sont dans une partie étendue de l'espace des relations entre organes,
et d'autressonsqui activentseulementles neuronesdont lesvecteurspréférés
biais sera introduit par l'usage d'un synthétiseur articulatoire réaliste durant
toute lasimulation.Pourlemoment,et pourrendrelacompréhensionplus
fa-cile,nousl'introduisonsdanslesystèmeenbiaisantdèsledépartladistribution
devecteurspréférés.
Jouer avec la distribution initiale, en particulier en utilisant une
distribu-tion uniforme,permet devoirquels résultatssontdus oune sontpasdusàla
présencedenon-linéaritésdanslafonctionquifaitcorrespondredessonsàdes
congurationsarticulatoires.En particulier,nousallonsmontrerquela
digita-litéainsi quelacompositionaliténenécessitentpasdenon-linéaritéspourêtre
expliquées,cequiestassezoriginalétantdonnéeslesthéoriesexistantesdansla
littérature(voirlechapitre4).
6.1.6 Pré-supposition 6: Pas d'intéractions coordonnées
Lesagentssontdans un monde danslequel ils se déplacentaléatoirement.
Adesmomentsaléatoires,ilsproduisentunevocalisation,quiestentenduepar
les agents qui sont proches d'eux, et aussi par eux-mêmes (ils ne font pas la
diérence entre un son produit par eux-mêmes ou parquelqu'un d'autre). Le
choixdecombiend'agentsentendentlavocalisationproduiteparl'und'euxne
l'onchoisitun,deux,trois ouplusd'agents.Pourlagénéralité,lessimulations
présentéesdessousn'utilisentqu'unseulagent.D'unpointdevuealgorithmique,
c'est équivalentà choisir aléatoirement deux agents dans la population, et de
faire produire une vocalisationàl'un qui est entendueet traitée par lesdeux
agents.
6.1.7 Ce qu'on ne pré-suppose pas
Les agents nejouent pas unjeu de langage au sens employédans la
litté-rature (Hurford et al., 1998; Steels,1997), et en particulierne jouent pas au
jeu d'imitation qui est utilisédans (de Boer, 2001;Oudeyer,2001b: Oudeyer,
2002c).Leursinteractionsnesontpasstructurées,iln'yapasderôlesetpasde
coordination.Enfait,ils n'ontpasbesoind'avoirdecapacitéssocialesdutout.
Ilsnefontpasladiérenceentreleurspropresvocalisationsetlesvocalisations
des autres. Ils ne communiquent pas. Ici, communication désignel'émission
d'un signal par unindividu avec l'intentionde porter une information qui va
modierl'étatd'aumoinsunautreagent,cequinesepassepasici.Eneet,les
agentsnesaventmêmepasqu'ilyad'autresagentsqu'euxautourd'eux, donc
ilseraitdicile dedirequ'ilscommuniquent.
6.2 La dynamique
6.2.1 Cas où la distribution initiale est uniforme
Nous allonsmaintenantdécrirece qui arriveàune populationd'agentsqui
implémententcespré-suppositions.L'espacedesrelationsentreorganesseraici
mono-dimensionnel,etladistributioninitialeserauniforme.Dans cettepartie,
σ = 0.001
et ilya150
unités nerveuseset 10agents.0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
agent 1 agent 2
espace des relations entre organes
espace des relations entre organes
Fig. 6.8 Distribution initiale des vecteurs préférés des unités nerveuses de deux
agents; l'espace desrelationsentreorganes, enabscisses,esticimono-dimensionnel;
Lesagentsproduisentdesvocalisationsspéciéespardesobjectifsarticulatoiresrépartis
surtout lecontinuum (lesvocalisationssontanalogues).
audébutd'unesimulation.L'axedesabscissesreprésentel'espacedesrelations
entre organes (par exemple le lieu d'articulation ou la rondeurdes lèvres), et
lespointsquilaparcourentsontlesvecteurspréférésdesunitésnerveusesd'un
agent.L'axedesordonnéesreprésenteladensitédesvecteurspréférés(cela
per-metdemieuxvoircommentilssontrépartis,surtoutsibeaucoupdepointssont
les uns sur les autres). Nous voyonsqu'ils sont approximativement distribués
uniformément. Comme laloi d'apprentissage desunités nerveuses fait que les
agentstendentàproduirelamêmedistributiondesonsquecellequ'ilsentendent
autour d'eux, et commeinitialement tous les agents produisent à peu près la
même distribution de sons, la situation initiale est un équilibre et est
symé-trique.C'estunesituationdanslaquellechaquecartenerveuseestdansunétat
chapitre 3 (à la diérence qu'on aici une population de cartesnerveuses qui
interagissentles unes avecles autres). A causede la stochasticitédans le
mé-canisme,il vayavoirdesuctuations.L'étude del'évolutiondesdistributions
montre quel'équilibre initial est instable: lesuctuations fontchangerle
sys-tèmed'état. Lagure6.9montreladistribution desvecteurspréférésdesdeux
mêmesagents2000vocalisationsplustard.Nousvoyonsquemaintenantilya
mêmesagents2000vocalisationsplustard.Nousvoyonsquemaintenantilya