• Aucun résultat trouvé

Performances de localisation du système auditif

La localisation auditive est un processus complexe d’intégration d’informations auditives, visuelles et cognitives, que le cerveau améliore au cours du plus jeune âge, et qui continue tout au long de la vie. De nombreux travaux psychoacoustiques ont étudié la capacité du système auditif humain à localiser une source sonore réelle, et ont permis d’établir des performances moyennes de localisation en situation d’écoute réelle. Ces études, généralement effectuées en milieu anéchoïque, exposent distinctement les performances de localisation en azimut et en élévation. Cette dichotomie ne présente qu’un intérêt pratique, et ne présume en rien d’un traitement cérébral équivalent. De plus, elles explorent la précision de localisation dite « statique » du système auditif, c’est-à-dire pour des événements sonores et des auditeurs immobiles, où du moins considérés comme tel.

2.5.1 Précision de localisation en azimut

Blauert [Bla97] fait un rapport exhaustif des études sur la localisation auditive. La précision de localisation est estimée ici comme l’amplitude de déplacement de la source sonore engendrant la perception d’un changement de position de celle-ci. Cette valeur est couramment appelée localization blur (flou de localisation en français). La figure I-6 expose de manière synthétique les performances de localisation en azimut dans le plan horizontal estimées en termes de flou de localisation. La capacité de discrimination des sources apparaît bien plus marquée devant et derrière que sur les côtés, et meilleure devant que derrière. La précision est de l’ordre de ±4° devant, ±6° derrière, ±10° pour les positions latérales.

Perception auditive et synthèse binaurale

Une autre étude importante menée par Oldfield et Parker [OP84a] estime la précision de localisation en azimut comme l’erreur entre la position réelle d’une source et la position pointée par les différents sujets testés. La précision de localisation est donc indiquée en termes d’erreur de localisation, et non de flou (voir Fig. I-7, image du haut). On remarque que pour l’avant et l’arrière, les résultats sont cohérents avec ceux de Blauert. On note cependant que l’erreur estimée ici est plus importante pour les positions latérales arrière pouvant atteindre des valeurs de l’ordre de 15°. L’erreur absolue moyenne en azimut est également évaluée en fonction de l’élévation (voir Fig. I-7, image du bas). On remarque que celle-ci évolue peut et reste inférieure à 10°.

2.5.2 Précision de localisation en élévation

La figure I-8 présente les performances de localisation en élévation dans le plan médian rapportées par Blauert, et indique que les positions frontales sont les mieux discriminées, et que, pour les positions zénithales, le localization blur atteint des valeurs de l’ordre de ±20°. Oldfield et Parker reporte quand à eux une précision de localisation en élévation dans le plan médian quasi-constante de l’ordre de 8°, et une erreur moyenne de localisation en élévation en fonction de l’azimut quasi-constante également de l’ordre de 10° (voir Fig. I-9).

2.5.3 Jugements confus liés à la tâche de localisation auditive statique

Nous appelons jugement confus une erreur de localisation de forte amplitude. Les jugements confus reportés dans la littérature sont généralement des confusions avant/arrière pour lesquels les sons sont perçus derrière alors que la source est positionnée devant, confusions arrière/avant pour lesquels les sons sont perçus devant alors que la source est positionnée derrière.

Oldfield et Parker reporte un taux de confusion moyen selon la direction avant/arrière de l’ordre de 4%. Wightman et Kistler [WK89] reporte eux une moyenne de l’ordre de 6%. On peut donc considérer qu’en milieu anéchoïque et lors d’une tâche de localisation « statique », une probabilité de confusion avant/arrière de l’ordre de 5% est représentative des performances du système auditif humain.

Perception auditive et synthèse binaurale

Fig. I-6 : Précision de localisation en azimut dans le plan horizontal d’après Blauert [Bla97]

Perception auditive et synthèse binaurale

Fig. I-8 : Précision de localisation en élévation dans le plan médian d’après Blauert [Bla97]

Perception auditive et synthèse binaurale

3 HRTF ET TECHNIQUE BINAURALE

La technique binaurale repose sur une reproduction au niveau du conduit auditif de l’auditeur des informations acoustiques nécessaires à la construction par le système auditif d’une image sonore spatiale. Cette technique peut être exploitée de deux manières, différentes par leur implémentation, mais néanmoins très proches, puisque toutes deux basées sur l’écoute binaurale naturelle.

L’enregistrement binaural consiste à placer des microphones dans les oreilles d’une tête, humaine ou artificielle, et à enregistrer une scène sonore. La diffusion au casque de l’enregistrement se fait alors sans matriçage des signaux.

La synthèse binaurale consiste à simuler un enregistrement binaural à l’aide des HRTF. Il suffit d’effectuer la convolution entre un son monophonique, représentant une source sonore, et les HRTF associées à l’auditeur et à la position simulée, et de diffuser le résultat au casque.

Fig. I-10 : Exemple de têtes binaurales utilisée pour la technique binaurale

Le principe des enregistrements binauraux a été développé dans les années 1960 et a surtout contribué à la définition de têtes artificielles (voir Fig. I-10), sensées être représentatives d’une morphologie d’un auditeur moyen. Les indices perceptifs présents dans un enregistrement binaural effectué avec une tête artificielle sont donc liés à la morphologie de celle-ci. La synthèse binaurale a connu un véritable essor dans les années 1990, les progrès de l’informatique rendant alors abordable la conception et l’étude de systèmes de spatialisation basés sur ce principe. Différentes dénominations (le plus souvent en langue anglaise) sont utilisées dans la littérature pour faire référence à ce genre de systèmes : 3D-audio [Beg94], VAD pour Virtual Auditory Display [WAKW93], VAS pour Virtual Auditory Space [Car96], ou encore VAI pour Virtual

Perception auditive et synthèse binaurale

synthétisée contient les indices perceptifs liés aux filtres utilisés pour effectuer cette synthèse, et sont donc liés à la morphologie associée à ces filtres. Cependant, dans ce dernier cas, il est possible d’intervenir sur les filtres et donc de les choisir en fonction de l’auditeur. Dans cette section, nous nous intéresserons uniquement à la synthèse binaurale et au processus de création de filtres de spatialisation.