I
NTRODUCTIONL’expression « informatique musicale », tout comme celle de « musique savante » fait partie des idiosyncrasies inhérentes à la langue (et à la culture) française, encore que cela soit surtout vrai de la seconde. On emploie quelquefois Musical Informatics en anglais tout en préférant Computer Music ou Music Technology, et l’allemand accepte Musikinformatik. L’adjectif « savant » pour la musique est traduit par scholarly, serious, classical qui ne reflètent que partiellement le sens pris en français par ce qualificatif. Ces considérations terminologiques rappellent que chaque culture met l’accent sur des aspects variés d’une réalité complexe et multiforme. Dans la culture scientifique et artistique française il semble que ces deux thèmes constituent le prisme par lequel de telles réalités sont abordées : le contenu savant des musiques est mis au premier plan, et l’informatique est assumée comme science de référence (subsumant alors mathématique, physique, cognition) mise au devant des moyens intellectuels recherchés pour décrypter et mettre en œuvre ces structures musicales dites
« sérieuses » c’est à dire en réalité riches et complexes.
Pionnier de l’informatique musicale en France, et médaille d’or du CNRS, Jean- Claude Risset rappelle dans l’entretien retranscrit dans ce même numéro le bouleversement qu’il ressent lorsqu’il entre en contact avec le langage Music IV de Max Matthews (implémenté par John Chowning à Stanford) aux Bell Laboratories au milieu des années soixante. Il comprend immédiatement le potentiel illimité d’un langage de programmation de haut niveau par opposition à la programmation ad-hoc des modules de synthèse, sans limite a priori de complexité des structures imaginables (en dehors des limites de calculabilité qui deviendront critiques et seront prises en considération plus tard, lorsque les problèmes combinatoires lourds et la programmation logique entreront dans le champ de l’informatique musicale).
Cette approche que Max Mathews (crédité de l’invention de l’informatique musicale) défendait dès le début des années soixante a fortement influencé dès sa création à la fin des années soixante, un centre de recherche comme l’Ircam (hôte de l’unité mixte de recherche STMS, Sciences et technologies de la musique et du son).
Et dès le début des années 1970, les langages Music n dédiés à la synthèse sonore y furent introduits par John Chowning, inventeur de la synthèse par modulation de fréquence.
C’est ainsi que quelques années plus tard, ce centre produisait dans les années quatre-vingt-dix deux langages de programmation qui allaient avoir un impact international et se partager le champ de l’informatique musicale en deux grands paradigmes : Max (en hommage à Max Mathews) pour le traitement en temps-réel des signaux sonores et événementiels dans le temps de la scène ; et OpenMusic, pour la conception, la représentation et la simulation des structures musicales de haut niveau mises en jeu en composition dans le (long) temps différé qui précède la réalisation en concert. Ces deux paradigmes (qui préexistaient, mais cristallisèrent
Cet article des Editions Lavoisier est disponible en acces libre et gratuit sur tsi.revuesonline.com
564 TSI. Volume 33 – n° 7-8/2014
alors fortement dans ces deux langages dont l’utilisation deviendra mondiale) structurent alors et pour longtemps le paysage de l’informatique musicale. D’un côté le monde de la performance, de l’interaction, du signal (au sens du traitement du signal numérique, modèle mathématique de choix pour l’analyse, le traitement et la synthèse des sons), de l’acoustique. De l’autre le monde des structures formelles et des symboles, du signe musical. Les implémentations, les langages supports de ces langages spécialisés (pourtant offrant tous deux une interface de programmation visuelle) diffèrent : programmation en C, pilotes de bas niveau dans un cas, et programmation en Lisp, intégration de paradigmes multiples (fonctionnel, objet, logique) dans l’autre.
Ces deux langages sont pris ici comme représentatifs d’une vision du domaine partagée par toute la communauté et qui caractérisent deux classes comportant d’autres représentants : citons par exemple CommonMusic ou PWGL pour la composition, ou SuperCollider pour la synthèse et l’interaction. Mais les langages de programmation ne peuvent se multiplier à l’infini, un régime darwinien féroce en règle l’évolution et la survie. Les langages pour la synthèse de son (Music n, Csound toujours présent) ont tendance à se fondre dans l’un ou l’autre des deux royaumes : synthèse en temps-réel pour le paradigme de type Max, contrôle compositionnel de la synthèse pour le paradigme de type OpenMusic (c’est-à-dire construction de formes dans le temps et génération de paramètres pour la synthèse, qui peut alors être opérée par un autre programme, notamment Max).
Les deux royaumes communiquent un peu (formats de données, protocoles de flux tels que MIDI ou OSC), mais l’intégration conceptuelle se fait attendre, car se profile en arrière-plan une question beaucoup plus fondamentale, celle de l’intégration des approches orientées signe et des approches orientées signal, soit l’alliance des structures symboliques et des traitements numériques quantitatifs. Plus près de nous, cette question est sans arrêt posée à nouveaux frais dans les sciences informatiques, avec par exemple une antinomie de plus en plus flagrante entre
« domaine des nombres/modèles discrets » et « monde physique/modèles continus » dans le domaine émergent des systèmes « cyber-physiques » auxquels se rattache notamment le système Antescofo décrit dans l’article de José Echeveste.
La dualité signe/signal ou symbolique/signal, a ainsi été fortement structurante de la communauté d’informatique musicale pendant de nombreuses années (disons les années quatre-vingt dix et deux mille). La thématique de l’interaction musicien- machine qui s’est considérablement développée depuis s’est plutôt rangée du côté du signal dans la mesure où sa première contrainte technique est de capter le son des musiciens pour le traiter en temps-réel. En parallèle, la question, centrale dans les études scientifiques de la musique, de la perception des sons et de la cognition musicale, restait relativement absente du champ informatique, même si de nombreux travaux de modélisation étaient produits par les acousticiens et les spécialistes du traitement de signal, en particulier dans la définition des descripteurs audio multipliés sans retenue dans la littérature et dont un nombre significatif découlent des études perceptives (par exemple, la description des hauteurs en mels et des
Cet article des Editions Lavoisier est disponible en acces libre et gratuit sur tsi.revuesonline.com
Introduction 565
intensités en sonies). Un descripteur comme le MFCC (Mel Frequency Cepstral Coefficients) qui signe une caractéristique timbrale à partir d’une représentation temps-fréquence multi-échelle et peut-être extrait avec une efficacité permettant le temps-réel est aujourd’hui très employée dans les systèmes interactifs pour l’« écoute artificielle » du musicien.
La rencontre des paradigmes signe et signal, de la problématique de l’interaction, et de la question cognitive a produit l’émergence d’un nouveau type d’études que nous avons qualifiées d’interaction symbolique pour manifester le recentrage opéré par ces approches de l’interaction (qui comporte bien entendu toujours une forte composante traitement du signal) plus près des structures formelles et de la cognition. Un article comme celui de Jérôme Nika et Marc Chemillier dans cette édition est représentatif de ce « paradigme » en voie d’établissement.
Composer et interagir constituent probablement l’alpha et l’oméga de l’informatique musicale depuis ses débuts dans les années cinquante. Les travaux récents et singulièrement ceux présentés dans ce numéro sont fondés sur une critique des approches classiques de ces deux activités, la première étant souvent conçue comme la substitution d’un algorithme à la tâche artisanale du compositeur, et la seconde étant souvent limitée à une activité réflexe (et non pas réflexive) de la part de l’ordinateur, ce qui, en musique, reviendrait à se limiter à la fonction d’ornementation.
Dans le premier cas (composer) trois catégories du temps sont à l’œuvre : le temps, abstrait et représenté plutôt comme une dimension spatiale, de la partition ; le temps du compositeur, qui travaille par touches rétrospectives ou prospectives, visitant ce temps de la partition selon un parcours complexe ; le temps informatique, celui du déroulement des algorithmes de génération et de transformations de structures musicales.
Dans le second cas (interagir), trois catégories de temps sont là aussi à l’œuvre : le temps phénoménologique, causal, du musicien qui constitue, vu (ou entendu) de l’ordinateur, un signal sonore orienté ; et le temps de ce que nous appellerons l’avatar du musicien, un modèle informatique doué de sa propre autonomie, élaboré a priori par des règles ou statistiquement à partir de l’analyse de la captation du musicien, qui se scinde lui-même en deux régimes temporels complexes : celui de la décision en fonction du passé modélisé – la mémoire – et celui de l’anticipation – la modélisation du futur.
Intégrer composition et interaction oblige à se poser la question de ces régimes temporels en relation avec la perception et la cognition musicale (et de plus en plus les modèles neurocognitifs) et engage des conceptions informatiques en termes de langages, d’architectures et d’algorithmes, qui ne peuvent plus se satisfaire des simplifications dichotomiques passées : environnement spécialisés séparant irrémédiablement formes symboliques et signal numérique ; interaction de type réactif versus de type traitement continu du signal ; ou encore clones par apprentissages de modèles humains versus intelligence artificielle embarquée dans
Cet article des Editions Lavoisier est disponible en acces libre et gratuit sur tsi.revuesonline.com
566 TSI. Volume 33 – n° 7-8/2014
des agents cybernétiques créatifs autonomes. La recherche évolue donc vers des modèles intégrés d’agents coopératifs et compétitifs (comme c’est déjà le cas d’Antescofo dans l’article de José Echeveste), capables d’embarquer un haut niveau d’intelligence musicale formelle appuyée sur des notions algébriques et topologiques (comme celles décrites par Louis Bigo et Antoine Spicher), ou bien sur des méthodes d’analyse algorithmique de partitions musicales (comme dans l’article de Mathieu Giraud et Marc Rigaudière), et enfin de manifester une forme de créativité artificielle dans leurs réactions aux humains ainsi que dans leur production autonome (comme dans les systèmes OMax et ImproTek décrits par Jérôme Nika et Marc Chemillier).
L’interaction symbolique qui se profile et dont les articles de ce numéro donnent déjà une idée forte et des déclinaisons variées vers le suivi de partition, vers la co- improvisation d’agents humains et machiniques, vers la musicologie computationnelle, vers la programmation spatiale de la musique, est selon nous le paradigme d’informatique musicale des années à venir. Il pose les défis importants de la convergence entre modèles de programmation et modélisation cyber-physique généralisée des interactions humains-machines, entre la musique vue d’avion comme espace et topologie, et la musique vue comme tissage temporel d’inter- subjectivités (incorporant des sujets numériques créatifs), entre temporalités de l’humain, de la partition et du programme dans leurs différents régimes de réalisation.
GÉRARD ASSAYAG IRCAM, UMR 9912 Science et technologie de la musique et du son
Cet article des Editions Lavoisier est disponible en acces libre et gratuit sur tsi.revuesonline.com