• Aucun résultat trouvé

Extension continue avec relativité absolue

Applications et démonstrations

5.1.4 Extension continue avec relativité absolue

c (a) p t 3 t a t 2 t 1 t seuil (b) seuil 1 t t2 a t 3 t p t 1 ' c

Figure 5.5 – (a) Si la confiance est élevée, une frappe arrivant trop tôt (t1) sera ignorée, une frappe proche de l’instant anticipé (t2) permettra la satisfaction de l’anticipation et le passage à la cellule suivante. La frappe sera supposé manquante et la transition sera spontanée peu après l’instant anticipé (t > t3). (b) Si la confiance est faible, n’importe quelle frappe (t1 ou t2) entraînera le passage à la cellule suivante. Il n’y aura en revanche pas de transition spontanée et la cellule attendra indéfiniment la frappe de l’utilisateur (t3).

la manière de la version 1 du TamTam. Si la confiance dans l’anticipation est forte, la transition pourra être spontanée, sans attendre la frappe de l’utilisateur (éventuellement absente ou brui-tée). De même, avec une forte confiance, la cellule ignorera les frappes lui parvenant trop tôt. Les courbes extrêmes produites selon le paramètre c sont représentées sur la figure5.5.

La confiance transmise à la cellule suivante est augmentée ou diminuée proportionnellement à l’écart entre le temps anticipé et le temps réel de la frappe. Ainsi après quelques frappes, les séquences qui ne sont pas en phase auront une confiance toujours faibles dans leurs anticipations et seront éliminées, ne laissant active qu’une séquence active si le rythme est assimilable. Si la synchronisation anticipative est perdue, les séquences seront toutes réactivées avec une confiance nulle (figure 5.5b) et adopteront un comportement réactif, attendant la prochaine frappe de l’utilisateur pour tenter de se synchroniser.

Ce nouveau modèle permet la synchronisation en un cycle maximum, toutes les phases étant envisagées simultanément. Il montre une grande résistance à la variabilité, au bruit ad-ditif ainsi qu’aux absences de frappes. L’adaptation à ses diverses perturbations ainsi qu’aux changements de tempo est illustrée par la figure 5.6. On peut se reporter à [Duverger, 2006;

Quinton, 2006] pour davantage de résultats empiriques.

De par les processus atomiques plus simples, la propagation d’activité et la régulation entre ses composants, on note déjà une progression vers le modèle complet présenté dans les chapitres précédents.

5.1.4 Extension continue avec relativité absolue

Bien que la version précédente soit très performante et robuste, certains aspects de conception semblent problématiques ou tout du moins discutables :

– Pour chaque Groupe, une seule Cellule est active à chaque instant. De plus, lorsque la synchronisation se produit, n − 1 séquences, codant les phases non adaptées (sur un total de n), deviennent inutiles et sont désactivées. Une telle redondance est-elle utile ? Est-elle biologique plausible, quel que soit le substrat ?

Temps

Création d'un schéma

Anticipations (schémas) Frappes (utilisateur)

Assimilation partielle Anticipation des notes futures Fin Accélération Note manquante Note supplémentaire Synchronisation Accommodation 2 0 0 2 2 2 2 3 1 1 1 0 0 0 0 0 0 0 2 2 2 2 1 1 1 1 1 3 3 3 0 0 0 2 2 2 1 1 1 1 2 0 0

Figure 5.6 – Capture annoté du programme de TamTam dans sa deuxième version. Les chiffres indiqués au dessus de la ligne des anticipations correspondent au numéro de la cellule la plus active dans le rythme associé. Ici sont combinés le nouvel algorithme de synchronisation et l’apprentissage de rythmes nouveaux par variation/sélection. Cette visualisation à l’avantage de faire apparaître les futures notes anticipées au fur et à mesure de l’interaction avec l’utilisateur.

– Une frappe perçue avant le temps anticipé peut déclencher une transition irréversible vers la cellule suivante. Alors, une frappe parfaitement synchronisée avec l’anticipation précédente sera ignorée ou confondue avec la frappe suivante. La tendance est donc à l’accélération et entraîne une désynchronisation rapide.

Pour régler ces deux "problèmes" sans cette fois-ci viser une convergence plus rapide des paramètres vers leur valeur réelle, une nouvelle structure représentée sur la figure5.7 est intro-duite. Il n’y a plus qu’une seule séquence de cellules, mais toutes restent actives en permanence. Il n’y a plus de seuil ou de transition, donc plus d’activation ou de désactivation. Seul compte le niveau d’activité relatif de chaque cellule. Selon l’instant où elles sont perçues, les frappes ne seront donc plus inhibées mais n’auront qu’une trop faible influence pour modifier la dynamique de l’activité des cellules.

1 t t2 paramètres d'anticipation a t (b) cellule (a) sms p t ) t ( a 2 3 1 2 3 1

Figure 5.7 – (a) Dans cette troisième version du TamTam, chaque schéma (toujours le cercle en

pointillés est simplement constitué d’une séquence de Cellules, mais toutes simultanément

ac-tives. (b) Chaque cellule adapte continûment sa courbe paramétrée (cette fois-ci une gaussienne) en fonction des informations de synchronisation qu’elle reçoit. Plus la confiance est grande, plus la gaussienne est étroite et de maximum élevé. Une frappe ne modifiera les paramètres émis à la cellule suivante que si elle permet d’atteindre d’augmenter le niveau maximal atteignable par la cellule à ta. Ainsi la frappe à t1 n’aura aucun effet, contrairement à celle de t2.

Étant donné l’absence de redondance dans cette version, les différentes phases coexistent sous forme d’activité propagée dans une structure commune. Si le tempo diffère entre les dif-férentes cellules, certaines cellules risquent d’écraser les paramètres des cellules suivantes avec les informations qu’elles transmettent. Comment garantir alors que seule la phase qui assimile le mieux les frappes se stabilise ? La solution trouvée est de ne mettre à jour les paramètres d’une cellule que si la confiance dans l’anticipation précédente est supérieure à celle de la cellule considérée. Comme précédemment, toute cellule bénéficie d’un bonus d’activité en cas de frappe synchronisée de la part de l’utilisateur.

Que ce soit au niveau du parallélisme des éléments, de la continuité des variables, de la rela-tivité absolue entre les acrela-tivités, de l’utilisation de maximum ou de l’intégration des sensations et des anticipations en chaque cellule, on retrouve déjà les éléments essentiels du modèle complet défendu dans cette thèse.

Figure 5.8 – Capture annotée du programme de TamTam dans sa troisième version. La première ligne correspond aux frappes de l’utilisateur. Les autres sont les anticipations continuelles des cellules formant un rythme. La couleur code le niveau d’activité de chaque cellule. Un trait est d’autant plus noir que l’anticipation d’une frappe est forte. On remarque que la synchronisation se produit par la réduction progressive des dégradés, traduisant un affinement progressif des gaussiennes, c’est-à-dire une augmentation de la confiance. Les 3 phases subsistent en tant que potentialités, à des niveaux d’activité différents, mais une unique phase est caractérisée par des traits noirs et fins.

5.2 Stabilisation de pendule et interaction homme-machine

Suite aux développements du TamTam, j’ai souhaité revenir sur la régulation des actions, déjà abordée durant mon stage de Master. En effet, aucune action dans le TamTam n’influence la dynamique de l’agent et de l’environnement. Les frappes de l’utilisateur ne sont pas modi-fiées si le programme les assimile mal et celui-ci peut toujours se synchroniser ultérieurement. A l’inverse, si un schéma sensori-moteur propose des actions, celles-ci influencent les sensations, qu’elles soient correctes ou non. Une légère erreur ou perturbation dans les commandes motrices peut faire dériver les sensations qui deviendront rapidement inassimilables par le schéma, d’au-tant plus que le nombre de degrés de liberté est grand [Quinton, 2005].

Bien que ce ne soit pas l’unique solution envisageable, il semble donc logique de réguler les actions au même titre que la période ou la phase dans le TamTam. Cela signifie qu’en fonction du niveau d’assimilation d’un schéma, il faut déterminer quelles actions doivent être corrigées et de quelle façon, dans quelle mesure... Même si l’on a accès à l’erreur commise pour chaque sensation anticipée, on se heurte à des résolutions complexes de cinématique inverse. On retrouve

des modèles inverses pour palier à ce problème dans les Modèles internes présentés en première partie. Il faut connaître ou générer un tel modèle, en supposant qu’il n’est pas sous-déterminé par l’ensemble des sensations.

Maîtriser formellement la dynamique de l’environnement en tenant compte de tous les fac-teurs et des interactions avec l’agent est impensable, même dans le cas d’un système physique relativement simple comme celui qui sera utilisé dans cette application. Trouver les équations qui déterminent l’état du système à chaque instant n’est déjà pas évident, les résoudre relève de l’impossible. On se contente donc généralement d’un modèle approximatif.

Un dernier point est à prendre en compte : lorsqu’on effectue une action et que l’on observe une dérive par rapport à la conséquence prévue, on ne peut plus corriger l’action précédente. Un laps de temps s’est écoulé, le système a évolué et la situation a changé. Il ne faut donc pas choisir l’action qui aurait permis de satisfaire l’anticipation un instant avant, mais celle qui permettra de corriger le tir. On génère donc une nouvelle prédiction, en tout point similaire à la précédente. La régulation consiste donc à choisir à chaque instant l’anticipation la plus adaptée relativement à la situation présente et au but à atteindre.

On dispose déjà d’un modèle où un ensemble de schémas sensori-moteurs rentrent en concur-rence pour assimiler au mieux la dynamique. Si aucun des schémas connus n’assimile parfaite-ment la situation, pourquoi ne pas interpoler leurs actions pour qu’elles correspondent mieux à la situation, en attendant qu’un nouveau schéma plus adapté soit généré. Les dimensions per-ceptives et actives prennent alors des rôles symétriques, et l’interpolation peut être réalisée dans un espace commun : l’espace d’interaction est né. L’idée a germée et s’est développée lors de mon stage au NII à Tokyo, grâce à la bienveillance et aux conseils de Tetsunari Inamura, mon directeur sur place, qui m’a permis d’explorer cette piste [Quinton and Inamura, 2007].