• Aucun résultat trouvé

4. PARTIE 3 : LES RECHERCHES THÉORIQUES

4.2. L E MODÈLE INFORMATIQUE

4.2.1. Les différentes représentations d'une pièce musicale

Notre modèle est fondé sur les principes suivants, que nous allons exposer tout au long de ce chapitre.

Une pièce possède quatre représentations qui ont un objet informatique associé : - une représentation gestuelle

- une représentation partition - une représentation Auteur - une représentation en EPF

Ces représentations constituent les différentes formes que revêt l'information, et sur lesquelles s'appuie l'outil pédagogique, indépendamment du type de pratique mu-sicale considéré. Elles ont une structure de communication établie, dont on peut extraire des mécanismes de fonctionnement propres à chaque type de pratique musicale.

On distingue les formes statiques des formes dynamiques qui évoluent au cours du ou des pratiques musicales en jeu. On distingue aussi les formes en temps qui existent entre le début et la fin d'une séquence musicale, des formes hors temps qui décrivent globalement cette séquence. Une représentation peut avoir ou non un objet logiciel associé, et donc être appréhendable par le système.

Le modèle théorique

1° La représentation gestuelle

C'est une représentation dynamique et en temps. Son objet logiciel associé est une séquence MIDI ordonnée dans le temps, de la forme : <instant>, <hauteur>, [<vélocité>], <durée>.

MIDI est écrit ici pour Musical Instrument Digital Interface, qui est un proto-cole standard de communication de données événementielles pour la musique, bien connu des musiciens : nous n'allons pas détailler ici cette norme, dont la compréhension globale nous suffira. Ce qu'il faut en connaître sera développé au fur et à mesure de la rencontre des besoins.

Instants et durées peuvent être comptés par rapport à une métrique éventuelle, ou en temps absolu. Ainsi, cette représentation peut être appréhendée par le système sous la forme d'une suite de messages MIDI issus d'un capteur ins-trumental, clavier ou autre : on l'appelle alors représentation gestuelle vraie, par opposition à la représentation pseudo gestuelle qui est obtenue à partir d'une autre représentation, grâce à une transformation interne au système. La représentation gestuelle est presque toujours accompagnée de la repré-sentation sonore; elle provient soit de la correction d'une reprérepré-sentation gestuelle vraie par quantification et filtrage, soit de l'édition d'une représentation graphique, soit de la recherche et de l'extraction dans une bibliothèque de séquences pré-établies, ou d'une génération automatique par algorithme.

Le modèle théorique

84

2° La représentation graphique

C'est une représentation statique ou dynamique, mais hors temps. Sa forme canonique est l'écriture musicale traditionnelle simplifiée, mais des formes dérivées peuvent aussi être accueillies, moyennant certaines précautions. La description complète de cette représentation nous égarerait, car elle est très complexe, et fait appel de très près à des connaissances spécifiquement musicales : nos propositions concernant cette question feront l'objet d'une publication spécifique.

3° La représentation Auteur

C'est une représentation abstraite offerte au musicien, de façon souple et modulaire : en se l'appropriant, l'auteur pourra atteindre une description cultu-relle et artistique de l'œuvre. Elle se présente comme une série de descripteurs qu'on peut gérer et augmenter, et dont les plages de valeur sont elles-mêmes éditables. Cette représentation a essentiellement un rôle descriptif, et prend son sens dans la structuration de la Base de Donnée des pièces musicales. 4° La représentation en EPF

C'est la représentation en EPF qui structure la Base de Données des pièces musicales, en parallèle à la représentation Auteur. En effet cette représentation, eu égard à sa forte dimension sémantique et son caractère hors temps, était la meilleure candidate à supporter une Base de Données équipée de moyens de filtrage, de formalisation de requêtes symboliques et de requêtes numériques discrètes ou seuillées.

C'est l'objet de la suite que de décrire finement cette représentation. 5° La représentation informatique

C'est une représentation statique ou dynamique, hors temps, qui s'identifie à son objet logiciel associé, qui lui-même est plus général que chacun de ceux associés aux représentations présentées précédemment. C'est donc une représentation purement électronique et avant tout gestionnaire, que nous citons ici pour information.

6° La représentation sonore

Comme la représentation gestuelle, c'est une représentation en temps, qui peut être statique ou dynamique. Elle est produite par un mode de production sonore associé au système, soit pour interpréter une séquence à partir d'une forme pseudo gestuelle, soit comme témoin en temps réel d'un jeu instrumental.

Elle est toujours le produit d'autres représentations, et n'a pas d'objet logiciel propre, si ce n'est un choix de timbres pointant sur une bibliothèque attachée

Le modèle théorique

au synthétiseur, et des références éventuelles de hauteur et/ou de tempo, avant ou durant l'exécution.

Certaines de ces représentation sont génératives, d'autres non : il existe des outils d'aide à la traduction, qui possèdent un certain degré d'intelligence, mais que nous n'expliciterons pas en détail ici : il seront présentés sur des exemples dans la dernière partie de cette thèse.

Mis à part la représentation Auteur qui est indépendante de chacune des autres, les autres représentations ont des liens calculatoires les unes par rapport aux autres, comme suit : à partir du geste, on peut produire une partition approximative, c'est-à-dire opérer une première segmentation et quantification paramétrable des notes, gérer l'espace des portées et les références métriques et tonales si elles existent. Une représentation de certaines intentions reste cependant à la charge de l'utilisateur : gestion des voies, gestion de l'enharmonicité, gestion des groupements, et de manière générale gestion du style.

Par ailleurs, à partir de la partition, on peut produire du geste, c'est à dire jouer mécaniquement la partition : toutefois, les gestions locales et markovienne de la dynamique et de la prosodie sont possibles. Cependant, rien n'est entrepris en direc-tion de l'interprétadirec-tion, et là encore, le jeu est indépendant du timbre et de l'instrumentation. Tout ceci est possible grâce à la représentation informatique qui est un généralisé entre les deux représentations, et qui permet, moyennant des algo-rithmes généraux, de les obtenir toutes deux.

Enfin, à partir des représentations gestuelles et graphiques, qui se trouvent syn-thétisées dans la représentation informatique, on peut obtenir la représentation en EPF, c'est à dire une valorisation quantitative et délocalisée des attributs porteurs de forme. Cependant, rien n'est fait en terme de spécification de texte musical à partir de la représentation en EPF, ni de dérivation ou de génération automatique à partir de telles spécifications.

Le modèle théorique 86 analyse analyse le ct ur e, i nt er pr ét at io n éc ri tu re composition composition, improvisation pièce partition geste/son Auteur en EPF

Ainsi pour récapituler grossièrement, disons que la représentation sonore est atta-chée aux représentations gestuelle et graphique, et que la représentation gestuelle est réduite à sa forme MIDI. Quant à la partition traditionnelle, c'est la principale représentation graphique. Par ailleurs, une représentation en EPF existe, constituée d'éléments porteurs de forme qui sont prédéterminés, même s'il est assez facile d'étendre l'ensemble de ces éléments.

La représentation en EPF est utile aux opérations de sélection, d'évaluation, d'espionnage, de diagnostic et d'expertise; elle conditionne aussi, mais de manière entièrement éditable, les explications que pourra fournir le système sur demande. Voici quelques informations supplémentaires sur la nature des opérations de sélec-tion, d'évaluation et d'espionnage : nous en dirons davantage sur les opérations de diagnostic et d'expertise dans la suite.

1° la sélection dans une Base de Connaissance est une opération de filtrage : le système est entouré de plusieurs Bases de Connaissances, dont certaines sont de taille assez importantes, comme la base des pièces musicales; on y accède fréquemment et de manière centralisée, ce qui justifie la conception d'accès intelligents.

2° l'évaluation des représentations de type MIDI et de type graphique permet la création à un instant donné le calcul de la représentation en EPF. Ceci fait ap-pel à des techniques de regroupement visant à structurer les données de base de manière hors temps, en contrôlant la sémantique aux différents niveaux de la structure.

3° l'espionnage de l'élève par le système produit une trace chiffrée en temps du parcours de l'apprenant à travers les possibilités offertes, maintenue en vue d'appréhender son cheminement cognitif à haut niveau. De même, on maintient la trace de son protocole d'apprentissage devant un exercice donné.

Le modèle théorique

La tâche du cogniticien musicologue chargé de créer un modèle de représentation en EPF se décompose idéalement comme suit :

1° collecte de l'ensemble du vocabulaire musical concernant la description d'une pièce musicale, et délimitation d'une base de concepts pertinents

2° extraction d'un lexique significatif, vu comme un sous-ensemble des concepts hors temps

3° filtrage de ce lexique selon des critères de viabilité pédagogique, puis in-formatique : l'évaluation d'un concept donné se fait à partir de données en pro-venance des représentations gestuelle et/ou graphique, de manière algorith-mique, et doit être réalisable de façon fiable en un coût non prohibitif.

On est en face du problème de la mise en place d'un jeu de descripteurs pertinents, adéquats, et cohérents. On exige de plus que ces descripteurs soient calculables, fa-ciles à conceptualiser, et abstraits du contexte : or cette relation de contexte, de succession, est très difficile à contourner. Sans détailler nos différentes ébauches et le long chemin qui nous a permis de retenir un ensemble d'EPF, nous en donnons la liste en annexe 2.