• Aucun résultat trouvé

Chapitre 3 : Configuration du dispositif TheVIBE

3.4 Codage sonore

3.4.6 Codage de la tonie

La tonie est définie, dans le standard ANSI (standard Américain), par "cet attribut de la sensation auditive selon lequel les sons peuvent être classés sur une échelle de valeurs allant du grave à l'aigü. La tonie dépend principalement du contenu fréquentiel du stimulus sonore, mais aussi de son intensité et de la forme d'onde du stimulus"5.

5 "Pitch is that attribute of auditory sensation in terms of which sounds may be ordered on a scale extending from low to high. Pitch depends mainly on the frequency content of the sound stimulus, but it also depends on the sound

Tout comme pour la sonie, plusieurs échelles psychophysiques de tonie ont été définies, selon le déterminant comportemental considéré. Par ailleurs, la capacité du système auditif à discriminer deux fréquences est essentiellement proportionnelle à la fréquence du signal. Dans une large gamme l'hypothèse de Weber est vérifiée (fig. 3.33), et une échelle logarithmique en fréquence est donc convenable pour le codage de la tonie dans le logiciel TheVIBE (voir discussion au §3.3.1).

La tonie dépend également de la sonie, comme le souligne le standard ANSI. Pour une augmentation de 30 dB, les courbes d'isotonie présente des variations de l'ordre de 10-15 Hz pour toutes les fréquences (Klein, 1981, cité dans Blauert, 1997).

Une distinction importante entre la sonie et la tonie à été soulignée par Stevens. Ce dernier propose de distinguer, en psychophysique, les continuum "prothétiques" et les continuum "métathétiques". Les continuums prothétiques correspondent à des processus physiologiques additifs comme la sonie : augmenter l'intensité d'un signal sonore augmente la fréquence des potentiels d'actions émis par les neurones sélectionnés. Ainsi, un son ne peut pas posséder deux sonies, les intensités des stimulus se cumulent.

La tonie en revanche est un continuum métathétique, dans le sens où la variation de la fréquence du signal entraine l'activation d'un ensemble différent de neurones. En ce sens, le processus physiologique mis en jeu n'est plus additif. Plusieurs fréquences peuvent alors êtres discriminées dans un seul son.

Dans le cas des continuums métathétiques, un nouvel élément intervient dans la capacité de discrimination du système sensoriel : le masquage. Dans un signal constitué de deux fréquences suffisamment proches, la fréquence la plus énergétique peut masquer l'autre composante du signal. Le sujet ne perçoit alors plus que la composante de forte énergie, c'est à dire un son pur.

Les expériences de masquage ont conduit à la détermination de bandes critiques, qui délimitent des intervalles de fréquence dans lesquels on observe un phénomène de masquage. Si deux

pressure and the waveform of the stimulus" (American National Standard (ANSI), 1994, from Hartmann, 1997. Figure 3.33 : Just Noticeable Difference en

fréquence pour des sons purs de différentes intensités. Wiek et al., 1977, d'après Hartmann, 1997.

Figure 3.34 : bandes critiques et échelles en Bark. En a, alignement des bandes critiques le long de la membrane basilaire ; en b et c, correspondance entre la bande critique (en ordonnée) et la fréquence en abscisse (échelle linéaire en b et logarithmique en c), d'après Buser et Imbert, 1987.

fréquences sont situées dans deux bandes critiques différentes, leur interaction ne sera pas significative. Au sein d'une même bande critique en revanche, le processus physiologique mis en jeu n'est que partiellement non additif et la fréquence de plus faible énergie aura tendance à être masquée.

L'interprétation proposée pour rendre compte de ces bandes de fréquence est qu'elles correspondent à une unité neurale sur la membrane basilaire (fig. 3.35). Ainsi, si deux fréquences sont dans une même bande, elles seront codées par les mêmes neurones et le processus sera donc additif.

Les travaux pionniers dans ce domaine ont été réalisés par Zwicker et ses collaborateurs (Zwicker et al., 1957 ; Zwicker, 1961). Ces derniers définissent 24 bandes critiques. L'échelle issue de ces bandes critiques (numérotées de 1 à 24) est le Bark. La figure 3.35 présente le lien entre l'échelle en Barks et l'échelle fréquentielle. Au delà de 500 Hz, la relation est quasi-logarithmique. Néanmoins, la différence entre l'échelle logarithmique et l'échelle en Bark lors de l'utilisation d'un dispositif de substitution (The vOICe, Meijer, 1992) est nettement perceptible.

Intérêt dans le cas du dispositif TheVIBE :

Nous avons vu que l'un des aspects essentiels pour l'établissement d'un couplage sensori-moteur à l'aide du dispositif TheVIBE est la capacité du système auditif à discriminer les différentes sources sonores qui composent le signal. Ces sources se différencient par leur fréquence et par leur azimut apparent.

En distribuant de manière équitable les niveaux des sources sonores dans les différentes bandes critiques de l'échelle en Bark, on minimise l'interaction entre ces différentes sources, non seulement en ce qui concerne la dimension fréquentielle (discrimination de deux sources par leur fréquence), mais aussi en ce qui concerne leur sonie (discrimination de la sonie de chaque source séparément).

Par ailleurs, dans la mesure où cette propriété est vraie pour chaque oreille individuellement, cette capacité à bien discriminer les écarts de sonie entre les différentes sources sonores améliore également la discrimination de l'IAD.

En pratique :

Dans la première expérience, l'échelle utilisée était tout simplement l'échelle de fréquence. Dans les expérimentations suivantes, nous avons utilisé une échelle en Barks.

Il n'y a pas de formule analytique exacte pour convertir l'échelle des fréquences en barks (z). Une formule approximative est néanmoins fournie par Traunmüller (1990) :

z= 26,81

11960/ f 0,53

Cette formule est inversible et permet de calculer une fréquence en fonction de l'échelle en Bark :

f= 1960

26.81/z−1

On déduit alors les fréquences permettant d'obtenir une répartition linéaire des niveaux en Bark. L'échelle utilisée s'étend de 300 Hz à 3000 Hz, soit de la bande z=3 à la bande z=15.

3.4.7 Choix du nombre de champs récepteurs et du taux de