Au niveau de sons isolés - La structure des sons et leur perception

4.2 La structure des sons et leur perception

4.2.2 Au niveau de sons isolés

La simulation de sons à partir du ressenti (décrit verbalement, par une

scène visuelle ou autre) nécessite l’identification de paramètres ou

struc-tures morphologiques du signal responsables de la représentation mentale

que l’on se fait lorsqu’on écoute un son. Plus précisément on cherche le

“squelette” ou l’invariant du son qui permet la reconnaissance du

phéno-mène sonore indépendamment de la situation d’écoute, de la source etc.

Cette structure ou consistance timbrale expliquerait pourquoi on reconnaît

par exemple un son métallique, même s’il provient de sources très variées

(plaques, cloches, barres, de grandes ou petites dimensions) ou la voix d’un

proche indépendamment des émotions exprimées et même lorsqu’elle est

déformée (par le téléphone par exemple). Dans ce cadre, des sons isolés ont

été étudiés dans le but d’identifier les paramètres du signal responsables

de leur catégorisation perceptive. A travers des protocoles expérimentaux,

la reconnaissance de matériaux et de mouvements ont été étudiés. Le lien

entre qualité sonore et paramètres du signal a également été abordé par le

biais de bruits de portières automobile et de sons issus de différents espèces

de bois jugés par un luthier de xylophone.

Catégorisation perceptive de sons d’impact

en vue de la construction d’un synthétiseur de sons d’impacts permettant

de contrôler les sons à partir de mots décrivant différentes catégories de

matériaux (Bois, Métal, Verre, ...). Cette étude, qui a fait l’objet d’une

collaboration étroite avec Mitsuko Aramaki et Mireille Besson à l’Institut

de Neurosciences Cognitives de la Méditerranée, nous a amené à effectuer

plusieurs expériences axées sous différents angles d’investigation. Les

résul-tats sont présentés dans cette section ainsi que dans les sections (4.3.3) et

(4.4.1).

Des sons d’impact issus de différents matériaux frappés (Bois, Métal,

Verre) ont été enregistrés et analysés. Une méthode de synthèse additive a

été utilisée pour resynthétiser les sons. Pour minimiser des variations

éven-tuelles de timbre induites par des différences de hauteur entre sons, tous

les sons ont été égalisés (au même chroma (Do)). Les sons ont également

été égalisés en sonie. En interpolant les paramètres de synthèse (amplitudes

et coefficients d’amortissement), des continua entre les trois catégories de

matériaux (bois-verre, bois-métal et verre-métal) ont été construits. Cette

méthode a permis de simuler des transitions progressives entre catégories

de matériaux. 5 continua de 20 sons intermédiaires ont été construits pour

chaque transition donnant au total 330 sons. Ces sons ont été présentés

dans un ordre aléatoire à des sujets qui devaient les classer le plus

rapi-dement possible dans une des trois catégories de matériaux à l’aide d’un

boîtier comportant trois boutons de réponse. 22 participants (droitiers et

non-musiciens) entre 19 et 35 ans ont été testés dans l’expérience. Des

mesures éléctrophysiologiques (Electroencephalogramme, EEG) ont été

en-registrées en continu durant l’expérience à l’aide de 32 électrodes localisées

sur le salp. Le résultats issus de ces mesures sont décrites dans la section

(4.3.3). Les résultats comportementaux correspondant à la catégorisation

et au temps de réaction des sujets, ont permis de mettre en évidence une

zone de continuum entre catégories de matériau pour chaque transition et

de distinguer des sons typiques (classés dans une même catégorie par plus

de 70 % de sujets) et des sons ambigus. Cette distinction entre sons

ty-piques et sons ambigus a été utilisée ultérieurement lors d’une expérience

d’amorçage de sons environnementaux décrite dans la section (4.3.2). Les

résultats montrent que les participants ont plus souvent classé les sons dans

la catégorie métal que dans les catégories verre et bois et que les temps de

réactions étaient plus grandes pour des sons issus de la catégorie verre que

pour ceux issus des catégories bois et métal [Aramaki et al., 2009a].

Pour établir un lien entre paramètres acoustique et catégories issus des

tests catégorisation, des corrélations entre catégories de sons typiques et

descripteurs acoustiques ont été recherchées. Parmi les descripteurs qui se

sont déjà révélés pertinents pour la perception de timbre et l’identification

de matériaux, nous avons ici étudié le temps d’attaque (AT), le centre de

gravité spectral (CGS), la largeur de bande (SB), la rugosité (R) et

l’amor-tissement normalisé du son (α). Une approche statistique basée sur une

méthode de régression logistique binaire a permis de proposer des modèles

prédictifs pour chaque catégorie de matériaux. Les résultats de ces analyses

ont révélés que α est le facteur prédictif principal de la catégorie bois (85%)

et de la catégorie métal (82.7%), mais que des descripteurs spectraux, à

savoir le centre de gravité spectral et la largeur de bande pour la catégorie

bois et la largeur de bande pour le métal sont également importants pour la

catégorisation. En ce qui concerne la catégorie verre, tous les descripteurs

testés sauf le temps d’attaque se sont révélés importants et la catégorie

verre ne pouvait pas être prédite par seulement un ou deux paramètres.

Contrairement aux catégories bois et métal, la catégorie verre est mieux

décrite par les propriétés spectrales que par l’amortissement.

Pour définir un espace de contrôle de matériaux permettant un contrôle

intuitif des sons, une analyse statistique basées sur une ACP (Analyse en

Composantes Principales) a été effectuée. Cette analyse a permis de

re-présenter les trois catégories de sons dans un espace bidimensionnel. En

calculant la corrélation entre dimensions et descripteurs acoustiques, on a

pu déduire que l’amortissement est responsable de la distinction entre la

catégorie Bois et la catégorie Métal et que la rugosité est responsable de la

distinction de la catégorie verre. Ces résultats sont exploités dans le

synthé-tiseur de matériaux frappés décrit dans la section (4.4.1) [Aramaki et al.,

2009b].

Qualité sonore des bois de luthérie

Les sons d’impact ont également été utilisés dans le cadre d’une étude visant

à lier la qualité sonore et les caractéristiques physiques des bois de lutherie.

Cette étude a été effectuée en collaboration avec le CIRAD, Montpellier (L.

Brancheriau et H. Baillères). Une méthodologie originale a été proposée,

associant des processus d’analyse-synthèse à des tests de classification

per-ceptive. Les sons produits en impactant 59 lames de bois issues d’espèces

différentes mais toutes de même géométrie, ont été enregistrés et distribués

de façon aléatoire sur un écran d’ordinateur sous forme d’icônes simples.

Un luthier de renom devait ensuite réorganiser ces sons le long d’un l’axe

horizontal en fonction de son jugement de la qualité musicale du son. Les

sons jugés de bonne qualité ont été classés à droite et les sons les moins

ap-préciés à gauche. Le luthier pouvait écouter les sons autant de fois qu’il le

souhaitait. Pour extraire des descripteurs de timbre responsables de la

clas-sification du luthier, les sons ont été resynthétisés, égalisés en pitch et classés

de nouveau par le luthier qui ne savait pas que les sons étaient synthétiques.

Des corrélations entre descripteurs acoustiques, les propriétés mécaniques

et anatomiques du bois et le classement du luthier ont été obtenus par

régression linéaire multivariée [Dillon and Goldstein, 1984]. Les résultats

montrent que l’amortissement de la première composante spectrale ainsi

que l’étendue spectrale sont les principaux descripteurs acoustiques

respon-sables de la classification. Ce résultat indique que le luthier recherche des

sons très résonnants et cristallins. En ce qui concerne les caractéristiques

mécaniques du bois, le coefficient de friction interne semble être le principal

paramètre corrélé à la classification du luthier [Aramaki et al., 2007].

Cette étude a permis d’identifier les principaux critères perceptifs

utili-sés par un luthier lors de la classification de différents espèces de bois. Ces

résultats donnent des pistes quand aux choix de nouvelles espèces de bois

utilisables pour la facture instrumentale et ont permis d’induire des projets

de recherches ambitieux, portés par le CIRAD et axés sur la modification

génétique des arbres en vue de l’optimisation de leurs propriétés "sonores".

L’identification de descripteurs acoustiques corrélés au classement est

éga-lement importante pour la synthèse et le design de nouveaux instruments

numériques.

Sons de fermeture de portières automobiles

Une troisième étude a été effectuée sur des sons d’impacts d’une catégorie

bien particulière à savoir les sons de fermeture de portières automobiles.

Cette étude a fait l’objet d’une collaboration entre CNRS-LMA et le PSA

Peugeot Citröen dans le cadre de la thèse (CIFRE) de Marie-Céline Bezat

que j’ai co-encadré. Du point de vue industriel, l’objectif de cette thèse était

de mieux corréler les attendes des clients par rapport aux sons de fermeture

de portières automobiles et d’utiliser ces connaissances dans le processus

de conception en dimensionnant correctement certaines pièces mécaniques

constituant les portières. Ce travail nécessite à la fois de connaître le

juge-ment perceptif des bruits de portières et d’expliquer ce jugejuge-ment par des

propriétés acoustiques et mécaniques des sons. Pour aborder ce problème,

des études perceptives sur des sons réels issus de différentes marques et

gammes automobiles ont été effectuées. Puis une approche par

analyse-synthèse a été adoptée afin de tester des stimuli parfaitement calibrés et

lier les paramètres du signal au ressenti.

Le jugement perceptif a été étudié sur plusieurs plans. Les sujets ont

jugé les sons en situation réelle, en manipulant des portières sur des

véhi-cules de différentes marques et gammes. Puis les sons ont été enregistrés

en chambre semi anéchoïque à l’aide d’une tête acoustique pour différentes

vitesses de fermeture et présentés aux sujets en laboratoire. Et enfin, une

série de vidéos présentant un expérimentateur manipulant des portières de

véhicule différentes a été enregistrée pour étudier l’influence de l’image sur

le ressenti. Les mêmes marques et gammes de véhicules ont été utilisées

tout au long des expériences. Ainsi les évaluations de qualité de véhicule

que renvoient ces bruits ont pu être comparées. En confrontant les

résul-tats en laboratoire avec sons uniquement et les résulrésul-tats IN SITU ou les

sujets sont face au véhicule, on observe que l’image du véhicule (surtout

la gamme) influence largement l’évaluation de la qualité avec une meilleure

évaluation pour les véhicules qui ont une meilleure image et vice versa. Pour

analyser plus avant l’influence de l’image du véhicule, les sujets ont ensuite

évalué des associations bruits - véhicules obtenus par des montages vidéo.

La comparaison des résultats avec ceux obtenus lors d’évaluations avec des

sons seuls montre que l’image du véhicule n’influence que légèrement

l’éva-luation de la qualité que renvoie le bruit de fermeture, mais que l’influence

observée sur véhicule réel est bien supérieure. L’introduction du facteur

image au laboratoire n’est donc pas représentative du facteur réel. Dans le

cadre de l’évaluation de sons au laboratoire, les résultats ont montrés que

l’augmentation de la vitesse de fermeture pénalise l’évaluation de la qualité

que renvoie le bruit de fermeture. En situation réelle, le comportement des

sujets a été filmé et les sujets ont été interrogés sur les évocations que

ren-voient ces bruits. Cette approche a permis d’identifier trois profils de sujets,

à savoir les inquiets, les conviviaux et les esthètes. Trois types d’évocation

ont également été identifiés, à savoir la solidité/sécurité (chez les inquiets),

le confort (chez les conviviaux) et la distinction (chez les esthètes).

Dans cette étude, 2 types d’écoute ont été distingués selon la définition

de Gaver (1993), à savoir l’écoute analytique (“musical listening”) et l’écoute

écologique (“everyday listening”). L’écoute analytique est caractérisée par

une écoute des propriétés intrinsèques du son décrite par les descripteurs

de timbre, les descripteurs acoustiques, la durée, etc (paramètres du signal,

paramètres sensoriels). L’écoute écologique est caractérisée par les

proprié-tés naturelles qui font référence à la source et aux évocations que renvoie

le son (solidité, qualité). Plusieurs tests ont été effectués pour identifier les

propriétés analytiques et naturelles impliqués dans l’écoute des bruits de

portières.

En ce qui concerne l’écoute analytique, une analyse sensorielle a été

effectuée pour caractériser les sons du point de vue sensoriel. Cette

ap-proche consiste à entraîner un groupe de sujets à caractériser des sons par

quelques composantes perceptives à travers des mots ou d’onomatopées.

Dans le cadre de bruits de portières, les “caractéristiques” KE, BOMN,

IN-TENSE, ESPACHOC, Gri-gri, Triangle ont été identifiées par le panel. En

ce qui concerne l’écoute écologique, les propriétés naturelles liées à la

qua-lité, la solidité, l’énergie de fermeture, le poids de la porte ont été évalués.

Des experts PSA des ouvrant automobiles ont également évalué les

pro-priétés naturelles en sources organiques : présence serrure, crans de serrure,

vibrations de panneaux de porte. Enfin, un lien entre propriétés perceptives

a été établi pour construire un réseau perceptif caractéristique du bruit de

fermeture de porte.

Pour associer paramètres du signal et évocations liés aux bruits de

por-tières, une approche analyse-synthèse a été adoptée. Les propriétés

analy-tiques évoquées lors des tests perceptifs sont de bons indicateurs concernant

l’information perceptivement importante contenue dans le signal.

Notam-ment la caractérisation de propriétés naturelles données par les experts ont

permis de mettre en avant l’aspect serrure/fermeture du bruit. Ces deux

aspects ne sont pas faciles à distinguer à partir d’analyses traditionnelles

du signal. Une méthode modale empirique, “Empirical Mode Decomposition

(EMD) introduite par [Huang et al., 1998] et étudiée par [Flandrin et al.,

2004] a permis de séparer ces deux sources de façon satisfaisante du point de

vue perceptif. Le principe de cette méthode est d’identifier itérativement des

modes intrinsèques du signal modulés à la fois en amplitude et en fréquence,

en séparant localement (à l’échelle d’une oscillation) une contribution

“rapi-de” d’une tendance plus “lente”. Le signal est parfaitement reconstruit par

simple addition des modes. Ainsi, le bruit “fermeture” est obtenue à partir

des 6 premiers modes et le bruit “serrure” à partir des modes d’ordre

su-périeurs. La resynthèse des 2 types de bruits a été effectuée à partir d’un

modèle de synthèse de type additif développé par Aramaki [Aramaki and

Kronland-Martinet, 2006; Aramaki et al., 2006] simulant la répartition

spec-trale initiale et les lois d’amortissement exponentielles dans 40 bandes de

filtres dont la largeur correspond aux bandes critiques de l’oreille. Le bruit

“serrure” est simulé par 3 impacts et le bruit fermeture est simulé par un

impact. Le synthétiseur a été implémenté en temps-réel à l’aide du logiciel

Max/MSP et contrôlé par 28 paramètres indépendants. Ce modèle a permis

la génération de stimuli parfaitement calibrés et proches de sons réels. Des

tests perceptifs ont été effectués sur les sons de synthèse pour valider sa

qualité et lier les paramètres du signal aux évocations. Les résultats sont

illustrés dans la Figure 5 ci-dessous .

La figure montre que la propriété BONM est obtenue par une faible

présence de la partie “serrure” et une présence plus forte de la partie

“fer-meture”. Inversement, la propriété KE est obtenue par une forte présence

de la partie “serrure” par rapport à celui de la fermeture. BONM et KE

sont à leur tour responsables des évocations de poids de porte qui ensuite

influence l’image de solidité du véhicule. Les paramètres (“bas niveau”) du

signal qui sont responsables d’évocations de solidité et qualité sont en partie

Figure 5: La figure montre que la propriété BONM est obtenue par une

faible présence de la partie “serrure” et une présence plus forte de la partie

“fermeture”. Inversement, la propriété KE est obtenue par une forte présence

de la partie “serrure” par rapport à celui de la fermeture. BONM et KE

sont à leur tour responsables des évocations de poids de porte qui ensuite

influence l’image de solidité du véhicule.

liés aux niveaux des trois impacts du bruit (N1, N2 et N3), de durées inter

impacts (Tclic3-Tferm, Tclic3-Tclic2, ...), de sous bandes ERB contenants

le maximum d’énergie (Bmax2, Bmax3, ...), du niveau initial de l’impact

du bruit “fermeture” (Nferm) et de la lois d’amortissement de l’impact du

bruit “fermeture” (A).

Cette étude a permis de montrer que les descripteurs acoustiques

pro-posés permettent de prédire de façon robuste les propriétés analytiques de

notre ensemble de sons réels. De plus, afin de mieux comprendre les relations

complexes entre ces descripteurs et les propriétés perceptives, les propriétés

perceptives peuvent être caractérisées par des arbres de paramètres

inter-dépendants. L’organisation des paramètres permet d’accéder aux critères

acoustiques les plus influents d’un bruit particulier en fonction de sa

ca-ractérisation acoustique [Bezat et al., 2006; Bezat, 2007; Bezat et al., 2007,

2008].

Dynamique évoquée par les sons

L’étude présentée ci-dessous, concerne l’évocation de la dynamique (ou

mou-vement au sens du chef d’orchestre) induite par des sons. La notion de

dyna-mique est floue et ne repose pas forcément sur des caractéristiques physiques

liées aux sources sonores, ni sur une gestuelle, mais plutôt sur une

morpho-logie sonore complexe. L’utilisation de sons environnementaux pose dans ce

genre de problème la question de l’influence de nos acquis cognitifs. En effet,

l’association d’une source physique à un son, guide fatalement le ressenti

vers une représentation pragmatique du phénomène. Ainsi, personne

n’as-sociera au bruit d’une automobile une dynamique de type "s’élève", tant

la source physique est bien repérée. Les écoutes analytiques et écologiques

évoquées dans le cadre de bruits de portières automobile nous ont, elles

aussi, amené à aborder la question du choix des corpus sonores susceptibles

de favoriser un type d’écoute. Cette problématique n’est pas nouvelle et se

retrouve en dehors du champ scientifique. En effet, depuis les années 1940,

des compositeurs et des bruiteurs ont utilisé des sons nouveaux pour

fa-voriser certains types d’écoutes. Différents courants de musique consistant

à travailler directement sur le signal sonore ont vu le jour à cette époque,

tels la “musique concrète” basée sur l’association de sons enregistrés ou

syn-thétique (Pierre Schaeffer, 1910-1995) et “Elektronische Musik” basée sur

l’utilisation de générateurs de signaux et des sons synthétiques (Karlheinz

Stockhausen, 1928-2007). Dans son livre “Traité des objets Musicaux” de

1966 [Schaeffer, 1966], Pierre Schaeffer fait également mention de l’écoute

acousmatique qui correspond à l’écoute d’un son sans se référer à la cause

qui l’a produit. Ce concept avait déjà été utilisé par Pythagore (VIe siècle

avant J.C.) qui employait le terme acousmatique pour désigner une

situa-tion d’écoute attentive obtenue alors qu’il se plaçait derrière un rideau pour

enseigner à ses disciples, dans le noir, et dans un environnement totalement

silencieux. Ce type de point de vue peut-il nous guider dans la construction

de protocoles expérimentaux visant à mieux comprendre notre perception

des sons ? Y-a-t-il des sons qui favorisent des types d’écoute particuliers ? La

théorie de Schaeffer s’avère extrêmement intéressante dans ce contexte, et ce

pour plusieurs raisons. Tout d’abord du point de vue conceptuel, Schaeffer

introduit le terme “objet sonore” qui définit les sons qui une fois

enregis-trés ont une existence propre sans forcément de lien avec le “corps sonore”,

c’est à dire l’objet ou le phénomène à l’origine du son. Cette notion

dé-bouche ensuite sur une typologie apte à catégoriser l’ensemble des sons en

fonction de leur profil spectral (“masse”) et de leur dynamique (“facture”).

Par son aspect général, cette classification est extrêmement intéressante car

elle considère le son non plus comme une entité acoustique, mais comme

une structure complexe dotée d’une "morphologie" bien caractérisée. De

fait, elle sert de base à la construction de corpus sonores représentatifs de

l’ensemble des morphologies sonores rencontrées dans la nature, sans pour

autant recourir à des sons environnementaux bien repérés. La typologie de

Schaeffer est constituée de 28 catégories de sons dont neuf centrales,

définis-sant les “sons équilibrés”. Ces neuf catégories constituent des combinaisons

entre trois profils de “facture” (sons entretenues, impulsifs, itératifs) et trois

profiles de “masse” (hauteur tonale définie, complexe et variable).

L’étude sur la dynamique des sons s’inspire de la théorie de P.

Dans le document Vers le sens des sons: Modélisation sonore et contrôle haut niveau (Page 39-49)