Pré-supposition 2 : T raduction entre l'espace perceptuel

5.2 L'utilité des systèmes articiels

6.1.2 Pré-supposition 2 : T raduction entre l'espace perceptuel

per-ceptuel et l'espace des relations entre organes, et

traduction entre l'espace desrelations entre organes

et l'espace des activations musculaires.

Comme nous l'avons déjà dit plus haut, nous pré-supposons qu'un agent

étantdonné unsignalacoustique,qui est unetrajectoirecontinue,est capable

deretrouverlatrajectoirederelationsentreorganescorrespondante(c'est-à-dire

qui apermis deproduire leson). Au contraire,initialementles agentsne sont

pas capablesde retrouverles objectifs articulatoires qui ont serviàconstruire

latrajectoirederelations entre organes.Noussupposons aussiqu'étantdonné

une suite d'objectifs articulatoires dans l'espace des relations entre organes,

lesagentssontcapablesdetrouverunetrajectoiredansl'espacedesactivations

Fig.6.2 Lafonctiond'activationgaussienneutiliséepardéfautdanslessimulations

est celle avec

σ ² = 0.001

^. Êlleⁿ^'est ^pas^très ^spécique^: êlle^permet âux^neurones ^de

répondre signicativementsuràpeuprès10pourcentde l'espaced'entrée.

atteints.

Celavanouspermettreden'utiliser queleniveaudereprésentation

concer-nantlesrelationsentreorganesetdoncunevisualisationetunecompréhension

plus intuitive. Si nous avions utilisé lestrois représentations, comme

schéma-tisésurlagure6.3, nousaurionseutroiscartesnerveuses,chacunecomposée

d'unitésnerveusescodantunespace.Ilyauraitunecartenerveuseperceptuelle,

composéedeneuronesquirecevraientleursentréesdel'activationdelacochlée.

Ces entréespourraientêtredes formantsparexemple. Ensuite, il yaurait des

unitésnerveusesdansuncartedesrelationsentreorganes,quirecevraientleur

entrées des activations des neurones dans la carte perceptuelle. La troisième

cartenerveuseseraitcomposéed'unités nerveusescodantpourl'espacedes

ac-5.Lafonctionquifaitcorrespondrel'espacedesrelationsentreorganesàl'espacedes

acti-vationsmusculairesn'estpasunisomorphisme:unobjectifdansl'espacedesrelationsentre

organespeutêtreréalisésouventparplusieursorganesoucombinaisonsd'organes.Nous

sup-posonsqu'aumoinsunepossibilitépeutêtretrouvée.Commentlechoixentreplusieurs

pos-sibilitéspeutêtrefaitaétédécritdanslalittérature(Baillyetal.,1997).

6.Notez que cela veut dire que les agents ont le savoir-faire pour copier un son qu'ils

entendent, maiscelaneveut pas direqu'ilslefont. Enfait,commenous l'expliquerons,les

agents necopient jamais(n'imitentjamais)un son qu'ilsviennent d'entendre.Doncils ne

s'imitentpas et nous évitons la question Pourquoi s'imitent-ils?.Nous décrirons dans le

chapitre suivantcommentcetypedetraduction,que noussupposonsici,peut êtreapprises

Fig.6.3 Sinousavionsutilisélestroisreprésentations,etn'avionspaspré-supposé

lacapacitéàpasserdel'uneàl'autre,l'architecturegénéraledusystèmeseraitcelle-ci.

tivations musculaires, et recevant sesentrées des activations des neurones de

lacartedesrelationsentreorganes.Ensuite,l'activationdesneuronesdecette

dernière carte serait utilisée pour contrôler les organes, ce qui produirait du

son. Techniquement,supposerquelesagentssontcapables depasserd'une

re-présentation àl'autre veut dire que les connections entre les cartesnerveuses

sont telles que quand un son active la cochlée et les neurones dans la carte

perceptuelle, alors les neurones dans la carte des relations entre organes qui

sontle plusactivésontleur vecteur préféréqui correspond àlarelation entre

organequi aproduit le son.En outre, lesneuronesde lacartedes activations

musculaires qui sont le plus activés ont leur vecteur préféréqui correspond à

lacongurationmusculairequiaproduitcetterelationentreorganes.Plusieurs

papiers ont montré comment ces connections pouvaient être apprise au cours

d'unbabillage(Bailly etal.,1997;Oudeyer,2003b).

Parce que nous utilisons uniquement l'espace des relations entre organes,

les unités nerveuses ont desentréesdirectementcodéesentermes de relations

entreorganes.Laproductiond'unevocalisation,programméeparuneséquence

d'activationsde plusieurs

n _i

^comme^nousl'expliquons plusbas,consiste

seule-Fig.6.4 Nous utilisonsseulement le niveau de représentation des relationsentre

organes, puisque nous supposons que les agents sont capables de passer de l'espace

perceptuel à l'espace des relations entre organes, et de l'espace des relations entre

organesàceluidesactivationsmusculaires.

mentenlaformationd'unetrajectoirecontinuedansl'espacedesrelationsentre

organes.Lesagentsnes'échangentquecestrajectoires.Lagure6.4schématise

cettesimplication.

Ilyaaussiunmodulenoté inhibition/activation qui permet d'envoyerun

signalGO qui laisse une vocalisationêtre produite quand lesunités nerveuses

sontactivées.C'est-à-direqu'enl'absencedecesignal,lescommandesspéciées

parl'activation desunités nerveuses ne sontpas eectivement exécutées. Cela

veut dire que l'activation des

n _i

^par ^un ^son ^extérieur ^ne ^provoque ^pas

direc-tement lareproductiondece son. Lacopie nécessitelesignalGO.En fait, les

agents n'utilisent jamais ce signal GO quand ils viennent d'entendre un son,

mais seulement à des moments aléatoires, ce qui fait qu'ils ne copient pas ce

de haut niveau dans la trajectoire continue, et qui pourraient leur permettre

de trouver quels points correspondent aux objectifs articulatoires utilisés par

l'agentqui aproduit lavocalisation.Ilssegmententlatrajectoireen detoutes

petites parties, qui correspondent à la résolution temporelle de la perception

(si nous utilisions lestrois représentations, cela correspondraitàla résolution

temporelle de la cochlée). Ensuite, chacune de ces petites parties est

moyen-née 7

,cequidonneune valeurdansl'espacedesrelationsentreorganes,qui est

alorsenvoyéeauxunitésnerveuses.Cesunitésnerveusessontalorsactivées

sui-vantlaformule quel'on adonnéedansla sectionunités nerveuses.Lagure

6.5 schématise ce traitement.L'axe des abscissesreprésente le temps, et l'axe

des y représente l'espace des relationsentre organes.Ici l'espace des relations

entre organesest mono-dimensionnel.Laligne continuereprésente une

vocali-sation perçue parl'agent. Les petits segmentsqui lasectionnent représentent

lesmoyennesdespetitespartiesqueleltretemporel extrait.Cesvaleurssont

lesentréesdonnéesséquentiellementauxunitésnerveuses.Lesunitésnerveuses

decetagentsontreprésentéessurl'axedesordonnées:chaquepointcorrespond

à unvecteurpréféré. En eet, ces points sont àvaleurdans l'espace des

rela-tionsentreorganes.Chacunedecesunitésnerveusesestactivéeparchacunedes

moyennes.

Quandellessontactivées,lesunitésnerveusessontmodiées.Celaveutdire

queleursvecteurspréféréssontchangés.Cechangementest unesensibilisation

austimuluspourlesneuronesquiontrépondusignicativement.Celaimplique

que si le même stimulus est donné en entrée juste après, alorsla réponse des

unitésnerveusesserauntoutpetitpeuplusforte.Lechangementesttrèsfaible

àchaquefois, et pondéréparlesactivationsde chaqueuniténerveuse(quiest

une valeur entre 0 et 1). Les unités qui sont très actives changent plus que

les unitésqui nele sont pas.La gure6.6 illustre le changement desvecteurs

préférés. Cette gure représente la fonction d'activation d'une unité nerveuse

avantqu'elle ne reçoiveune entrée, et après qu'elle en ait reçuet traité une:

le vecteur préféré, c'est-à-direle centre de la gaussienne, a été déplacé. Nous

voyonsqued'unpointdevuegéométrique,levecteurpréféréesttranslatévers

lestimulus.

Laformulemathématique delanouvellefonctiond'activation est:

tune _i,t+1 (s) = ^√ _2πσ ¹ ∗ e ^v ^i,t+1 ^−s| ² ^/σ ²

où

s

^est^le^stimulus,^et

v _i,t+1

^le^vecteur^préféré^de

n _i

^après^le^traitement^de

s

v _i,t+1 = v _i,t + 0.001 ∗ tune _i,t (s) ∗ (s − v _i,t )

6.1.4 Pré-supposition 4: Production

Laproductiond'unevocalisationconsisteàchoisiruneséquenced'objectifs

articulatoiresetàlesréaliser.Cesobjectifsarticulatoiressontspéciéspardes

relationsentreorganes,quisontmono-dimensionnellesdanslespremière

simula-tionsquenousallonseectuer.Pourchoisircesobjectifsarticulatoires,unagent

activeséquentiellement et aléatoirement des unités dans sa cartenerveuse, et

en mêmetemps envoie lesignalGO décrit plushaut.Cette activationest une

commande qui implémente le concept de geste dans cette thèse. Un objectif

Fig.6.5 Chaqueagentobtientune trajectoire continue(dansl'espacedesrelations

entre organes) quand il perçoit la vocalisation d'un autre agent. Il utilise alors un

ltrederésolutiontemporellequisegmentecettetrajectoireenuneséquencedeparties

trèscourtes.Pourchacune decesparties,oncalculelamoyenne,etlerésultatest un

stimulusquiest envoyéàlacartenerveuse, dontles unitéssontalorsactivées. Après

réceptiondechaque stimulusetactivationdesunités,celles-cisontmisesàjour.

système decontrôlequi exécuteces commandesenfaisantbougercontinûment

etséquentiellementlesrelationsentreorganesversl'objectif.

Sinousutilisions

les trois représentations,le système de contrôle activerait les musclesde telle

manièrequelesorganesseraientbougésversdes congurationssatisfaisantles

spécicationsde relations entre organes. Ici, lesystème de contrôle génère

di-rectementunetrajectoirecontinuedansl'espacedesrelationsentreorganesqui

passe par lesobjectifs. Cela est réalisé dans cette thèse par simple

interpola-8.Notezque cette manièredeproduire desvocalisations contient déjàdu discret. Nous

supposonsqueles vocalisationssont spéciéespar unesuited'objectifs.Ceciest enfaiten

accordaveclalittérature surlecontrôle moteurdesmammifères(Kandel etal., 2001),qui

le décrit comme étant organisé en deux niveaux: un niveau de commandes discrètes (nos

objectifsarticulatoires),etunniveauquis'occupedeleurexécution.Donclediscretquiest

présentdanslescommandesdiscrètesnedevraitpasêtreuntraitqu'ilfautexpliquerdansle

contextedesrecherchessurlesoriginesdelaparolepuisqu'ilestdéjàprésentdansl'architecture

decontrôlemoteur desmammifères.Cependant, nous nesupposonspasqu'initialementces

objectifs articulatoires sont organisés:l'ensemble des commandes utilisées pour dénir les

objectifs est un continuum, et iln'y a pas deré-utilisationd'objectifsarticulatoires d'une

vocalisation àl'autre; ladigitalité etlacompositionalitéseront unrésultatdessimulations.

Aussi,nous nesupposonspas qu'il ya dudiscretau niveaudela perception initialement,

dans le sensoù initialementlesagents nesontpas capables depercevoir desévènements

dans leuxsonore (cependant, àlanilserapossibled'identierlescatégories d'objectifs

f l (niveau d’activation de l’unité n )

i

Fig. 6.6 La mise à jour de chaque unité quand elle est activée par un stimulus

est tellequelevecteur préféré est changédemanière àceque l'unitérépondeunpeu

plus encore si l'on lui présentait de nouveau et juste après lemême stimulus. C'est

unesensibilisation desunités,quiest d'autantplusfortequandles neuronessonttrès

activés,etd'autantplusfaiblequandilssont peuactivés.

tion par des splines,c'est-à-dire par interpolation polynomiale (onpeut aussi

utiliser simplement des interpolations linéaires,qui ne modient en rien ni le

fonctionnementnilesrésultatsdessimulations).Lagure6.7schématisece

pro-cessusdeproduction.Surcettegure,l'axedesabscissesreprésenteletemps,et

l'axedesordonnéesreprésentel'espacedesrelationsentreorganes.Surl'axedes

ordonnées, on représente aussiles vecteurs préférésdes unités nerveuses de la

carted'unagent.Cinq decesunités sontactivéesséquentiellement,dénissant

les cinq objectifs articulatoires. Ensuite, lesystème de contrôle (interpolation

polynomiale)génèreunetrajectoirecontinuequipassepartouscespoints.Cette

trajectoireestlavocalisationqui seraperçueparlesagentsquil'entendront.

Le point crucial de cette pré-supposition est que les unités nerveuses

n _i

sont utiliséesà lafois dans leprocessus de perception et dans le processus de

production.Enconséquence,ladistributiondesobjectifsarticulatoiresquisont

utilisésdanslaproductionestlamêmequecelledesvecteurspréférés,qui

eux-Fig.6.7 Quandunagentproduitunevocalisation,plusieursobjectifsarticulatoires

sont spéciés par l'activation séquentielle aléatoire d'unités nerveuses. Les vecteurs

préférésdecesunitésnerveusesdénissentlesrelationsentreorganesquidoiventêtre

atteintes à destemps donnés.Cesactivations sontdes commandes quisont appelées

gestes enphonologiearticulatoire.Ensuite,unsystème de contrôleconstruitune

tra-jectoire continue quipassepartousles objectifsarticulatoires.

Cela implique quesi unagententend certainssonsplus souventqued'autres,

il aura tendance àlesproduire aussiplus souventqueles autres(ici, unson

désigneune des petites parties desvocalisationsrésultantdupassage dultre

temporel décrit plus haut). Notez que cela n'est pas réalisé par un processus

d'imitation, mais c'estuneet debordde l'augmentation delasensibilité des

neurones, qui est unmécanisme trèsgénérique de dynamique nerveusede bas

niveau(Kandeletal.,2001).

6.1.5 Pré-supposition5:Distributioninitialedes vecteurs

préférés

Lesvecteurspréférésdesunitésnerveusessontpardéfautinitialement

aléa-toiresselonunedistributionuniformedans laversiondebase dusystème. Une

distributionuniformeveutdirequ'ilyadesvecteurspréférésdanstoutl'espace

duisentdesvocalisationscomposéesd'objectifsarticulatoiresquisontdistribués

uniformémentsurtoutl'espace.Celaimpliquequ'initialementlecontinuumdes

gestes possibles est utilisé (donc il n'y a pas de digitalité), et parce qu'il y a

beaucoupdeneuronesrépartisdanstoutl'espace,laré-utilisationdesobjectifs

articulatoiresest trèsrareetdueauhasard(donciln'yapasde

compositiona-lité).Aussi,l'activation globaledelacartenerveuseesten amplitudelamême

quelquesoitlestimulus.

Cette pré-supposition sera modiée dans la version biaisée du système,

danslaquelleladistributioninitialedesvecteurspréférésneseraplusuniforme.

Une distribution biaisée veut dire qu'elle n'est pas symétrique: initialement,

certaines parties de l'espace des relations entre organescontiendront plus de

vecteurspréférésqued'autresparties.Cebiaispermetdeprendreencompteles

contraintesduesàlafonctionquifaitcorrespondredessonsàdescongurations

articulatoires.Une distribution uniformerevientàsupposer quecette fonction

estlinéaireetsymétrique.Unedistributionbiaiséeprendencomptelespossibles

non-linéarités.

En eet,si l'on regardele conduit vocal humain, il ya desrelations entre

organespourlesquellesunpetitchangementproduit unpetit changementdans

le son, mais il y a aussi des relations entre organes pour lesquelles un petit

changementproduit un grand changement dans le son. Si nous utilisions une

architecturecommecelle dela gure6.3,dans laquelle lesunitésnerveuses de

la cartedes relationsentre organes sont activées par les neuronesde la carte

perceptuelle,celaveutdirequ'ilyacertainssonsquiactiventsignicativement

des unités nerveuses de la carte des relations entre organesdont les vecteurs

préférés sont dans une partie étendue de l'espace des relations entre organes,

et d'autressonsqui activentseulementles neuronesdont lesvecteurspréférés

biais sera introduit par l'usage d'un synthétiseur articulatoire réaliste durant

toute lasimulation.Pourlemoment,et pourrendrelacompréhensionplus

fa-cile,nousl'introduisonsdanslesystèmeenbiaisantdèsledépartladistribution

devecteurspréférés.

Jouer avec la distribution initiale, en particulier en utilisant une

distribu-tion uniforme,permet devoirquels résultatssontdus oune sontpasdusàla

présencedenon-linéaritésdanslafonctionquifaitcorrespondredessonsàdes

congurationsarticulatoires.En particulier,nousallonsmontrerquela

digita-litéainsi quelacompositionaliténenécessitentpasdenon-linéaritéspourêtre

expliquées,cequiestassezoriginalétantdonnéeslesthéoriesexistantesdansla

littérature(voirlechapitre4).

6.1.6 Pré-supposition 6: Pas d'intéractions coordonnées

Lesagentssontdans un monde danslequel ils se déplacentaléatoirement.

Adesmomentsaléatoires,ilsproduisentunevocalisation,quiestentenduepar

les agents qui sont proches d'eux, et aussi par eux-mêmes (ils ne font pas la

diérence entre un son produit par eux-mêmes ou parquelqu'un d'autre). Le

choixdecombiend'agentsentendentlavocalisationproduiteparl'und'euxne

l'onchoisitun,deux,trois ouplusd'agents.Pourlagénéralité,lessimulations

présentéesdessousn'utilisentqu'unseulagent.D'unpointdevuealgorithmique,

c'est équivalentà choisir aléatoirement deux agents dans la population, et de

faire produire une vocalisationàl'un qui est entendueet traitée par lesdeux

agents.

6.1.7 Ce qu'on ne pré-suppose pas

Les agents nejouent pas unjeu de langage au sens employédans la

litté-rature (Hurford et al., 1998; Steels,1997), et en particulierne jouent pas au

jeu d'imitation qui est utilisédans (de Boer, 2001;Oudeyer,2001b: Oudeyer,

2002c).Leursinteractionsnesontpasstructurées,iln'yapasderôlesetpasde

coordination.Enfait,ils n'ontpasbesoind'avoirdecapacitéssocialesdutout.

Ilsnefontpasladiérenceentreleurspropresvocalisationsetlesvocalisations

des autres. Ils ne communiquent pas. Ici, communication désignel'émission

d'un signal par unindividu avec l'intentionde porter une information qui va

modierl'étatd'aumoinsunautreagent,cequinesepassepasici.Eneet,les

agentsnesaventmêmepasqu'ilyad'autresagentsqu'euxautourd'eux, donc

ilseraitdicile dedirequ'ilscommuniquent.

6.2 La dynamique

6.2.1 Cas où la distribution initiale est uniforme

Nous allonsmaintenantdécrirece qui arriveàune populationd'agentsqui

implémententcespré-suppositions.L'espacedesrelationsentreorganesseraici

mono-dimensionnel,etladistributioninitialeserauniforme.Dans cettepartie,

σ = 0.001

êt îl^yâ

150

ûnités ^nerveusesêt ¹⁰âgents.

0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

agent 1 agent 2

espace des relations entre organes

Fig. 6.8 Distribution initiale des vecteurs préférés des unités nerveuses de deux

agents; l'espace desrelationsentreorganes, enabscisses,esticimono-dimensionnel;

Lesagentsproduisentdesvocalisationsspéciéespardesobjectifsarticulatoiresrépartis

surtout lecontinuum (lesvocalisationssontanalogues).

audébutd'unesimulation.L'axedesabscissesreprésentel'espacedesrelations

entre organes (par exemple le lieu d'articulation ou la rondeurdes lèvres), et

lespointsquilaparcourentsontlesvecteurspréférésdesunitésnerveusesd'un

agent.L'axedesordonnéesreprésenteladensitédesvecteurspréférés(cela

per-metdemieuxvoircommentilssontrépartis,surtoutsibeaucoupdepointssont

les uns sur les autres). Nous voyonsqu'ils sont approximativement distribués

uniformément. Comme laloi d'apprentissage desunités nerveuses fait que les

agentstendentàproduirelamêmedistributiondesonsquecellequ'ilsentendent

autour d'eux, et commeinitialement tous les agents produisent à peu près la

même distribution de sons, la situation initiale est un équilibre et est

symé-trique.C'estunesituationdanslaquellechaquecartenerveuseestdansunétat

chapitre 3 (à la diérence qu'on aici une population de cartesnerveuses qui

interagissentles unes avecles autres). A causede la stochasticitédans le

mé-canisme,il vayavoirdesuctuations.L'étude del'évolutiondesdistributions

montre quel'équilibre initial est instable: lesuctuations fontchangerle

sys-tèmed'état. Lagure6.9montreladistribution desvecteurspréférésdesdeux

mêmesagents2000vocalisationsplustard.Nousvoyonsquemaintenantilya

Dans le document a gaiai de (Page 115-0)

Pré-supposition 2 : T raduction entre l'espace perceptuel

5.2 L'utilité des systèmes articiels

6.1.2 Pré-supposition 2 : T raduction entre l'espace perceptuel

σ 2 = 0.001

n i

n i

tune i,t+1 (s) = √ 2πσ 1 ∗ e v i,t+1 −s| 2 /σ 2

s

v i,t+1

n i

s

v i,t+1 = v i,t + 0.001 ∗ tune i,t (s) ∗ (s − v i,t )

f l (niveau d’activation de l’unité n )

i

n i

σ = 0.001

150

0

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

agent 1 agent 2

espace des relations entre organes

espace des relations entre organes

σ ² = 0.001

n _i

n _i

tune _i,t+1 (s) = ^√ _2πσ ¹ ∗ e ^v ^i,t+1 ^−s| ² ^/σ ²

v _i,t+1

n _i

v _i,t+1 = v _i,t + 0.001 ∗ tune _i,t (s) ∗ (s − v _i,t )

n _i