4.2 La structure des sons et leur perception
4.2.2 Au niveau de sons isolés
La simulation de sons à partir du ressenti (décrit verbalement, par une
scène visuelle ou autre) nécessite l’identification de paramètres ou
struc-tures morphologiques du signal responsables de la représentation mentale
que l’on se fait lorsqu’on écoute un son. Plus précisément on cherche le
“squelette” ou l’invariant du son qui permet la reconnaissance du
phéno-mène sonore indépendamment de la situation d’écoute, de la source etc.
Cette structure ou consistance timbrale expliquerait pourquoi on reconnaît
par exemple un son métallique, même s’il provient de sources très variées
(plaques, cloches, barres, de grandes ou petites dimensions) ou la voix d’un
proche indépendamment des émotions exprimées et même lorsqu’elle est
déformée (par le téléphone par exemple). Dans ce cadre, des sons isolés ont
été étudiés dans le but d’identifier les paramètres du signal responsables
de leur catégorisation perceptive. A travers des protocoles expérimentaux,
la reconnaissance de matériaux et de mouvements ont été étudiés. Le lien
entre qualité sonore et paramètres du signal a également été abordé par le
biais de bruits de portières automobile et de sons issus de différents espèces
de bois jugés par un luthier de xylophone.
Catégorisation perceptive de sons d’impact
en vue de la construction d’un synthétiseur de sons d’impacts permettant
de contrôler les sons à partir de mots décrivant différentes catégories de
matériaux (Bois, Métal, Verre, ...). Cette étude, qui a fait l’objet d’une
collaboration étroite avec Mitsuko Aramaki et Mireille Besson à l’Institut
de Neurosciences Cognitives de la Méditerranée, nous a amené à effectuer
plusieurs expériences axées sous différents angles d’investigation. Les
résul-tats sont présentés dans cette section ainsi que dans les sections (4.3.3) et
(4.4.1).
Des sons d’impact issus de différents matériaux frappés (Bois, Métal,
Verre) ont été enregistrés et analysés. Une méthode de synthèse additive a
été utilisée pour resynthétiser les sons. Pour minimiser des variations
éven-tuelles de timbre induites par des différences de hauteur entre sons, tous
les sons ont été égalisés (au même chroma (Do)). Les sons ont également
été égalisés en sonie. En interpolant les paramètres de synthèse (amplitudes
et coefficients d’amortissement), des continua entre les trois catégories de
matériaux (bois-verre, bois-métal et verre-métal) ont été construits. Cette
méthode a permis de simuler des transitions progressives entre catégories
de matériaux. 5 continua de 20 sons intermédiaires ont été construits pour
chaque transition donnant au total 330 sons. Ces sons ont été présentés
dans un ordre aléatoire à des sujets qui devaient les classer le plus
rapi-dement possible dans une des trois catégories de matériaux à l’aide d’un
boîtier comportant trois boutons de réponse. 22 participants (droitiers et
non-musiciens) entre 19 et 35 ans ont été testés dans l’expérience. Des
mesures éléctrophysiologiques (Electroencephalogramme, EEG) ont été
en-registrées en continu durant l’expérience à l’aide de 32 électrodes localisées
sur le salp. Le résultats issus de ces mesures sont décrites dans la section
(4.3.3). Les résultats comportementaux correspondant à la catégorisation
et au temps de réaction des sujets, ont permis de mettre en évidence une
zone de continuum entre catégories de matériau pour chaque transition et
de distinguer des sons typiques (classés dans une même catégorie par plus
de 70 % de sujets) et des sons ambigus. Cette distinction entre sons
ty-piques et sons ambigus a été utilisée ultérieurement lors d’une expérience
d’amorçage de sons environnementaux décrite dans la section (4.3.2). Les
résultats montrent que les participants ont plus souvent classé les sons dans
la catégorie métal que dans les catégories verre et bois et que les temps de
réactions étaient plus grandes pour des sons issus de la catégorie verre que
pour ceux issus des catégories bois et métal [Aramaki et al., 2009a].
Pour établir un lien entre paramètres acoustique et catégories issus des
tests catégorisation, des corrélations entre catégories de sons typiques et
descripteurs acoustiques ont été recherchées. Parmi les descripteurs qui se
sont déjà révélés pertinents pour la perception de timbre et l’identification
de matériaux, nous avons ici étudié le temps d’attaque (AT), le centre de
gravité spectral (CGS), la largeur de bande (SB), la rugosité (R) et
l’amor-tissement normalisé du son (α). Une approche statistique basée sur une
méthode de régression logistique binaire a permis de proposer des modèles
prédictifs pour chaque catégorie de matériaux. Les résultats de ces analyses
ont révélés que α est le facteur prédictif principal de la catégorie bois (85%)
et de la catégorie métal (82.7%), mais que des descripteurs spectraux, à
savoir le centre de gravité spectral et la largeur de bande pour la catégorie
bois et la largeur de bande pour le métal sont également importants pour la
catégorisation. En ce qui concerne la catégorie verre, tous les descripteurs
testés sauf le temps d’attaque se sont révélés importants et la catégorie
verre ne pouvait pas être prédite par seulement un ou deux paramètres.
Contrairement aux catégories bois et métal, la catégorie verre est mieux
décrite par les propriétés spectrales que par l’amortissement.
Pour définir un espace de contrôle de matériaux permettant un contrôle
intuitif des sons, une analyse statistique basées sur une ACP (Analyse en
Composantes Principales) a été effectuée. Cette analyse a permis de
re-présenter les trois catégories de sons dans un espace bidimensionnel. En
calculant la corrélation entre dimensions et descripteurs acoustiques, on a
pu déduire que l’amortissement est responsable de la distinction entre la
catégorie Bois et la catégorie Métal et que la rugosité est responsable de la
distinction de la catégorie verre. Ces résultats sont exploités dans le
synthé-tiseur de matériaux frappés décrit dans la section (4.4.1) [Aramaki et al.,
2009b].
Qualité sonore des bois de luthérie
Les sons d’impact ont également été utilisés dans le cadre d’une étude visant
à lier la qualité sonore et les caractéristiques physiques des bois de lutherie.
Cette étude a été effectuée en collaboration avec le CIRAD, Montpellier (L.
Brancheriau et H. Baillères). Une méthodologie originale a été proposée,
associant des processus d’analyse-synthèse à des tests de classification
per-ceptive. Les sons produits en impactant 59 lames de bois issues d’espèces
différentes mais toutes de même géométrie, ont été enregistrés et distribués
de façon aléatoire sur un écran d’ordinateur sous forme d’icônes simples.
Un luthier de renom devait ensuite réorganiser ces sons le long d’un l’axe
horizontal en fonction de son jugement de la qualité musicale du son. Les
sons jugés de bonne qualité ont été classés à droite et les sons les moins
ap-préciés à gauche. Le luthier pouvait écouter les sons autant de fois qu’il le
souhaitait. Pour extraire des descripteurs de timbre responsables de la
clas-sification du luthier, les sons ont été resynthétisés, égalisés en pitch et classés
de nouveau par le luthier qui ne savait pas que les sons étaient synthétiques.
Des corrélations entre descripteurs acoustiques, les propriétés mécaniques
et anatomiques du bois et le classement du luthier ont été obtenus par
régression linéaire multivariée [Dillon and Goldstein, 1984]. Les résultats
montrent que l’amortissement de la première composante spectrale ainsi
que l’étendue spectrale sont les principaux descripteurs acoustiques
respon-sables de la classification. Ce résultat indique que le luthier recherche des
sons très résonnants et cristallins. En ce qui concerne les caractéristiques
mécaniques du bois, le coefficient de friction interne semble être le principal
paramètre corrélé à la classification du luthier [Aramaki et al., 2007].
Cette étude a permis d’identifier les principaux critères perceptifs
utili-sés par un luthier lors de la classification de différents espèces de bois. Ces
résultats donnent des pistes quand aux choix de nouvelles espèces de bois
utilisables pour la facture instrumentale et ont permis d’induire des projets
de recherches ambitieux, portés par le CIRAD et axés sur la modification
génétique des arbres en vue de l’optimisation de leurs propriétés "sonores".
L’identification de descripteurs acoustiques corrélés au classement est
éga-lement importante pour la synthèse et le design de nouveaux instruments
numériques.
Sons de fermeture de portières automobiles
Une troisième étude a été effectuée sur des sons d’impacts d’une catégorie
bien particulière à savoir les sons de fermeture de portières automobiles.
Cette étude a fait l’objet d’une collaboration entre CNRS-LMA et le PSA
Peugeot Citröen dans le cadre de la thèse (CIFRE) de Marie-Céline Bezat
que j’ai co-encadré. Du point de vue industriel, l’objectif de cette thèse était
de mieux corréler les attendes des clients par rapport aux sons de fermeture
de portières automobiles et d’utiliser ces connaissances dans le processus
de conception en dimensionnant correctement certaines pièces mécaniques
constituant les portières. Ce travail nécessite à la fois de connaître le
juge-ment perceptif des bruits de portières et d’expliquer ce jugejuge-ment par des
propriétés acoustiques et mécaniques des sons. Pour aborder ce problème,
des études perceptives sur des sons réels issus de différentes marques et
gammes automobiles ont été effectuées. Puis une approche par
analyse-synthèse a été adoptée afin de tester des stimuli parfaitement calibrés et
lier les paramètres du signal au ressenti.
Le jugement perceptif a été étudié sur plusieurs plans. Les sujets ont
jugé les sons en situation réelle, en manipulant des portières sur des
véhi-cules de différentes marques et gammes. Puis les sons ont été enregistrés
en chambre semi anéchoïque à l’aide d’une tête acoustique pour différentes
vitesses de fermeture et présentés aux sujets en laboratoire. Et enfin, une
série de vidéos présentant un expérimentateur manipulant des portières de
véhicule différentes a été enregistrée pour étudier l’influence de l’image sur
le ressenti. Les mêmes marques et gammes de véhicules ont été utilisées
tout au long des expériences. Ainsi les évaluations de qualité de véhicule
que renvoient ces bruits ont pu être comparées. En confrontant les
résul-tats en laboratoire avec sons uniquement et les résulrésul-tats IN SITU ou les
sujets sont face au véhicule, on observe que l’image du véhicule (surtout
la gamme) influence largement l’évaluation de la qualité avec une meilleure
évaluation pour les véhicules qui ont une meilleure image et vice versa. Pour
analyser plus avant l’influence de l’image du véhicule, les sujets ont ensuite
évalué des associations bruits - véhicules obtenus par des montages vidéo.
La comparaison des résultats avec ceux obtenus lors d’évaluations avec des
sons seuls montre que l’image du véhicule n’influence que légèrement
l’éva-luation de la qualité que renvoie le bruit de fermeture, mais que l’influence
observée sur véhicule réel est bien supérieure. L’introduction du facteur
image au laboratoire n’est donc pas représentative du facteur réel. Dans le
cadre de l’évaluation de sons au laboratoire, les résultats ont montrés que
l’augmentation de la vitesse de fermeture pénalise l’évaluation de la qualité
que renvoie le bruit de fermeture. En situation réelle, le comportement des
sujets a été filmé et les sujets ont été interrogés sur les évocations que
ren-voient ces bruits. Cette approche a permis d’identifier trois profils de sujets,
à savoir les inquiets, les conviviaux et les esthètes. Trois types d’évocation
ont également été identifiés, à savoir la solidité/sécurité (chez les inquiets),
le confort (chez les conviviaux) et la distinction (chez les esthètes).
Dans cette étude, 2 types d’écoute ont été distingués selon la définition
de Gaver (1993), à savoir l’écoute analytique (“musical listening”) et l’écoute
écologique (“everyday listening”). L’écoute analytique est caractérisée par
une écoute des propriétés intrinsèques du son décrite par les descripteurs
de timbre, les descripteurs acoustiques, la durée, etc (paramètres du signal,
paramètres sensoriels). L’écoute écologique est caractérisée par les
proprié-tés naturelles qui font référence à la source et aux évocations que renvoie
le son (solidité, qualité). Plusieurs tests ont été effectués pour identifier les
propriétés analytiques et naturelles impliqués dans l’écoute des bruits de
portières.
En ce qui concerne l’écoute analytique, une analyse sensorielle a été
effectuée pour caractériser les sons du point de vue sensoriel. Cette
ap-proche consiste à entraîner un groupe de sujets à caractériser des sons par
quelques composantes perceptives à travers des mots ou d’onomatopées.
Dans le cadre de bruits de portières, les “caractéristiques” KE, BOMN,
IN-TENSE, ESPACHOC, Gri-gri, Triangle ont été identifiées par le panel. En
ce qui concerne l’écoute écologique, les propriétés naturelles liées à la
qua-lité, la solidité, l’énergie de fermeture, le poids de la porte ont été évalués.
Des experts PSA des ouvrant automobiles ont également évalué les
pro-priétés naturelles en sources organiques : présence serrure, crans de serrure,
vibrations de panneaux de porte. Enfin, un lien entre propriétés perceptives
a été établi pour construire un réseau perceptif caractéristique du bruit de
fermeture de porte.
Pour associer paramètres du signal et évocations liés aux bruits de
por-tières, une approche analyse-synthèse a été adoptée. Les propriétés
analy-tiques évoquées lors des tests perceptifs sont de bons indicateurs concernant
l’information perceptivement importante contenue dans le signal.
Notam-ment la caractérisation de propriétés naturelles données par les experts ont
permis de mettre en avant l’aspect serrure/fermeture du bruit. Ces deux
aspects ne sont pas faciles à distinguer à partir d’analyses traditionnelles
du signal. Une méthode modale empirique, “Empirical Mode Decomposition
(EMD) introduite par [Huang et al., 1998] et étudiée par [Flandrin et al.,
2004] a permis de séparer ces deux sources de façon satisfaisante du point de
vue perceptif. Le principe de cette méthode est d’identifier itérativement des
modes intrinsèques du signal modulés à la fois en amplitude et en fréquence,
en séparant localement (à l’échelle d’une oscillation) une contribution
“rapi-de” d’une tendance plus “lente”. Le signal est parfaitement reconstruit par
simple addition des modes. Ainsi, le bruit “fermeture” est obtenue à partir
des 6 premiers modes et le bruit “serrure” à partir des modes d’ordre
su-périeurs. La resynthèse des 2 types de bruits a été effectuée à partir d’un
modèle de synthèse de type additif développé par Aramaki [Aramaki and
Kronland-Martinet, 2006; Aramaki et al., 2006] simulant la répartition
spec-trale initiale et les lois d’amortissement exponentielles dans 40 bandes de
filtres dont la largeur correspond aux bandes critiques de l’oreille. Le bruit
“serrure” est simulé par 3 impacts et le bruit fermeture est simulé par un
impact. Le synthétiseur a été implémenté en temps-réel à l’aide du logiciel
Max/MSP et contrôlé par 28 paramètres indépendants. Ce modèle a permis
la génération de stimuli parfaitement calibrés et proches de sons réels. Des
tests perceptifs ont été effectués sur les sons de synthèse pour valider sa
qualité et lier les paramètres du signal aux évocations. Les résultats sont
illustrés dans la Figure 5 ci-dessous .
La figure montre que la propriété BONM est obtenue par une faible
présence de la partie “serrure” et une présence plus forte de la partie
“fer-meture”. Inversement, la propriété KE est obtenue par une forte présence
de la partie “serrure” par rapport à celui de la fermeture. BONM et KE
sont à leur tour responsables des évocations de poids de porte qui ensuite
influence l’image de solidité du véhicule. Les paramètres (“bas niveau”) du
signal qui sont responsables d’évocations de solidité et qualité sont en partie
Figure 5: La figure montre que la propriété BONM est obtenue par une
faible présence de la partie “serrure” et une présence plus forte de la partie
“fermeture”. Inversement, la propriété KE est obtenue par une forte présence
de la partie “serrure” par rapport à celui de la fermeture. BONM et KE
sont à leur tour responsables des évocations de poids de porte qui ensuite
influence l’image de solidité du véhicule.
liés aux niveaux des trois impacts du bruit (N1, N2 et N3), de durées inter
impacts (Tclic3-Tferm, Tclic3-Tclic2, ...), de sous bandes ERB contenants
le maximum d’énergie (Bmax2, Bmax3, ...), du niveau initial de l’impact
du bruit “fermeture” (Nferm) et de la lois d’amortissement de l’impact du
bruit “fermeture” (A).
Cette étude a permis de montrer que les descripteurs acoustiques
pro-posés permettent de prédire de façon robuste les propriétés analytiques de
notre ensemble de sons réels. De plus, afin de mieux comprendre les relations
complexes entre ces descripteurs et les propriétés perceptives, les propriétés
perceptives peuvent être caractérisées par des arbres de paramètres
inter-dépendants. L’organisation des paramètres permet d’accéder aux critères
acoustiques les plus influents d’un bruit particulier en fonction de sa
ca-ractérisation acoustique [Bezat et al., 2006; Bezat, 2007; Bezat et al., 2007,
2008].
Dynamique évoquée par les sons
L’étude présentée ci-dessous, concerne l’évocation de la dynamique (ou
mou-vement au sens du chef d’orchestre) induite par des sons. La notion de
dyna-mique est floue et ne repose pas forcément sur des caractéristiques physiques
liées aux sources sonores, ni sur une gestuelle, mais plutôt sur une
morpho-logie sonore complexe. L’utilisation de sons environnementaux pose dans ce
genre de problème la question de l’influence de nos acquis cognitifs. En effet,
l’association d’une source physique à un son, guide fatalement le ressenti
vers une représentation pragmatique du phénomène. Ainsi, personne
n’as-sociera au bruit d’une automobile une dynamique de type "s’élève", tant
la source physique est bien repérée. Les écoutes analytiques et écologiques
évoquées dans le cadre de bruits de portières automobile nous ont, elles
aussi, amené à aborder la question du choix des corpus sonores susceptibles
de favoriser un type d’écoute. Cette problématique n’est pas nouvelle et se
retrouve en dehors du champ scientifique. En effet, depuis les années 1940,
des compositeurs et des bruiteurs ont utilisé des sons nouveaux pour
fa-voriser certains types d’écoutes. Différents courants de musique consistant
à travailler directement sur le signal sonore ont vu le jour à cette époque,
tels la “musique concrète” basée sur l’association de sons enregistrés ou
syn-thétique (Pierre Schaeffer, 1910-1995) et “Elektronische Musik” basée sur
l’utilisation de générateurs de signaux et des sons synthétiques (Karlheinz
Stockhausen, 1928-2007). Dans son livre “Traité des objets Musicaux” de
1966 [Schaeffer, 1966], Pierre Schaeffer fait également mention de l’écoute
acousmatique qui correspond à l’écoute d’un son sans se référer à la cause
qui l’a produit. Ce concept avait déjà été utilisé par Pythagore (VIe siècle
avant J.C.) qui employait le terme acousmatique pour désigner une
situa-tion d’écoute attentive obtenue alors qu’il se plaçait derrière un rideau pour
enseigner à ses disciples, dans le noir, et dans un environnement totalement
silencieux. Ce type de point de vue peut-il nous guider dans la construction
de protocoles expérimentaux visant à mieux comprendre notre perception
des sons ? Y-a-t-il des sons qui favorisent des types d’écoute particuliers ? La
théorie de Schaeffer s’avère extrêmement intéressante dans ce contexte, et ce
pour plusieurs raisons. Tout d’abord du point de vue conceptuel, Schaeffer
introduit le terme “objet sonore” qui définit les sons qui une fois
enregis-trés ont une existence propre sans forcément de lien avec le “corps sonore”,
c’est à dire l’objet ou le phénomène à l’origine du son. Cette notion
dé-bouche ensuite sur une typologie apte à catégoriser l’ensemble des sons en
fonction de leur profil spectral (“masse”) et de leur dynamique (“facture”).
Par son aspect général, cette classification est extrêmement intéressante car
elle considère le son non plus comme une entité acoustique, mais comme
une structure complexe dotée d’une "morphologie" bien caractérisée. De
fait, elle sert de base à la construction de corpus sonores représentatifs de
l’ensemble des morphologies sonores rencontrées dans la nature, sans pour
autant recourir à des sons environnementaux bien repérés. La typologie de
Schaeffer est constituée de 28 catégories de sons dont neuf centrales,
définis-sant les “sons équilibrés”. Ces neuf catégories constituent des combinaisons
entre trois profils de “facture” (sons entretenues, impulsifs, itératifs) et trois
profiles de “masse” (hauteur tonale définie, complexe et variable).
L’étude sur la dynamique des sons s’inspire de la théorie de P.
Dans le document
Vers le sens des sons: Modélisation sonore et contrôle haut niveau
(Page 39-49)