• Aucun résultat trouvé

Configurations géométriques pour les antennes

Dans le document Analysis and synthesis of sound fields (Page 132-137)

Dans cette section, nous allons comparer les performances de plusieurs géométries d’antenne concernant le pouvoir de focalisation de celles-ci et le gain pour un bruit blanc, en utilisant pour l’analyse l’algorithme décrit à la section 5.4. Les antennes utilisées pour effectuer cette comparai- son sont les suivantes :

– deux antennes constituées de solides platoniciens inscrits dans 5 sphères dont les rayons sont logarithmiquement espacés entre 1 cm et 1 m. Les solides s’enchaînent soit dans l’ordre té- traèdre, octaèdre, cube, icosaèdre et dodécaèdre (“tocid” sur les légendes), soit dans l’ordre inverse (“dicot” sur les légendes). Ces antennes disposent toutes deux de 51 éléments ; – deux antennes circulaires de 51 éléments chacune, la première ayant un rayon de 1 m, et la

deuxième un rayon de 10 cm ;

– deux antennes en croix, chacune ayant 53 éléments (4 branches ayant chacune 13 micro- phones plus 1 microphone au centre) s’étalant de 1 cm à 1 m, l’une ayant un espacement linéaire (“cross linear”) et l’autre utilisant une répartition logarithmique pour l’espacement des microphones (“cross logarithmic”) ;

– une antenne ayant une répartition de microphones aléatoires de 51 éléments (“random”). Les coordonnées de chacun des microphones sont aléatoires mais réparties de manière uniforme entre −1 et 1.

Les résultats sont affichés sur la figure 5.19. Concernant le pouvoir de focalisation de ces différentes antennes, nous pouvons voir que celles qui obtiennent les meilleures performances sur toute la plage fréquentielle des signaux audio sont les antennes constituées de solides platoniciens, et plus particulièrement l’antenne “dicot” qui possède une plus forte densité de points au niveau du centre de l’antenne. Pour les deux antennes constituées de solides platoniciens, nous voyons clairement apparaître un pic de performance pour la longueur d’onde correspondant à l’inverse du diamètre de la sphère dans laquelle est inscrite le dodécaèdre, soit normalement 17000 Hz pour l’antenne “dicot” et 170 Hz pour l’antenne “tocid”. Les pics de performance observés apparaissent à 10000 Hz et 260 Hz, donc il existe un léger écart, mais l’ordre de grandeur est à peu près respecté. Concernant les antennes en croix, nous pouvons voir qu’il vaut mieux utiliser une répartition logarithmique des échantillons qu’une répartition linéaire, pour laquelle nous observons une chute de performances à partir de environ 2000 Hz. L’espacement des microphones pour cet antenne est de 7 cm. Si nous considérons qu’il faut au moins deux microphones par longueur d’onde, ce la correspond à une longueur d’onde critique de 14 cm, soit une fréquence de 2000 Hz. Le pouvoir de focalisation de l’antenne en croix à répartition logarithmique des échantillons possède un pouvoir de focalisation quasiment constant sur toute la bande de fréquences.

Concernant les antennes circulaires, nous voyons qu’elles sont bien adaptées pour la plage de fréquences correspondant aux longueurs d’onde de l’ordre du diamètre de l’antenne circulaire, soit 170 Hz pour l’antenne circulaire de rayon 1 m, et 1700 Hz pour l’antenne de rayon 10 cm.

Finalement, nous observons que le pouvoir de focalisation de l’antenne aléatoire est très bon à basses fréquences, et très mauvais à hautes fréquences, avec une rapide chute des performances. Il s’agit d’un tirage, nous n’avons pas effectué de millions de tirage afin d’obtenir une antenne qui aurait pu avoir des performances plus optimales.

Concernant la partie droite de la figure 5.19, nous pouvons voir que les antennes constituées de solides platoniciens amplifient plus le bruit blanc par rapport à d’autres antennes. La plage de

Configurations géométriques pour les antennes 102 103 104 0 10 20 30 40 50 60 70 frequency (Hz) percent (%)

Power focalisation ratio dicot tocid cross linear cross logarithmic circular 1m circular 10cm random 102 103 104 108 1010 1012 1014 frequency (Hz) log scale

White noise gain dicot tocid cross linear cross logarithmic circular 1m circular 10cm random

FIG. 5.19 – Étude de l’influence de la géométrie de l’antenne sur le pouvoir de focalisation de l’an-

tenne (gauche) et sur le gain pour un bruit blanc (droite), pour différentes géométries (se reporter au texte).

dynamique d’amplification du bruit blanc est de deux ordres de grandeur environ, de 109 à 1011

environ, soit une plage de 20 dB, ce qui n’est pas très important. De plus, nous n’avons pas utilisé de régularisation pour atténuer l’amplification du bruit.

Conclusion sur l’analyse de champs sonores par antenne de micro-

phones

Ce chapitre a exposé des méthodes permettant de faire l’analyse de champs sonores à partir des données récoltées par une antenne de microphones. Nous avons particulièrement attaché de l’importance sur les liens entre la physique des champs sonores, et les méthodes de traitement de signal pour le filtrage spatial.

En particulier, cette façon de procéder nous a permis de démontrer que l’analyse de champs sonores était le résultat de deux formations de voies successives : la première est une formation de voies continue effectué au niveau de chaque microphone de l’antenne de capteurs, et la deuxième est une formation de voies discrète pondérant de manière variable les mesures récoltées par chacun des microphones de l’antenne afin de filtrer la composante spatiale d’intérêt du champ sonore. La première formation de voie est imposée par le type de microphones employée dans l’antenne, et il s’agit d’un paramètre à prendre en compte au moment de la conception de l’antenne, tandis que la deuxième n’utilise que du traitement du signal qui peut être effectué postérieurement à l’acquisition des données. Il s’agit donc d’un procédé d’une extrême flexibilité.

L’objectif initial de notre méthode était d’imiter les mécanismes de la perception auditive, qui réalise une sorte d’analyse temps-espace/fréquence-vecteur d’onde. Nous avons mis au point un algorithme de formation de voies permettant de focaliser l’énergie du filtre spatial dans une certaine direction et de minimiser l’énergie du même filtre pour les autres directions. Le critère utilisé réalise cette optimisation en considérant l’ensemble complet (continu) des directions d’in- cidences possibles, ce qui a été rendu possible en utilisant le développement en série d’une onde plane en harmoniques sphériques. Comme nous l’avons montré, cela permet de s’affranchir de la difficulté relative à la conception du maillage de l’ensemble des directions d’incidence lorsque des algorithmes de formation de voies qui optimisent la réponse du filtre spatial uniquement sur un ensemble discret de directions d’incidence sont utilisés.

Pour les algorithmes réalisant une optimisation sur un ensemble discret d’ondes planes, nous avons introduit le concept de rapidité de variation de la phase spatiale afin de fixer des conditions

Configurations géométriques pour les antennes sur l’angle maximal devant séparer deux directions d’incidence du maillage utilisé pour l’opti- misation. Nous avons procédé de manière analogue lorsque l’optimisation était réalisée sur un ensemble discret d’harmoniques sphériques, où nous avons précisé l’ordre de la décomposition

Lnécessaire pour représenter correctement la réponse du filtre spatial. Dans les deux cas, ondes

planes ou harmoniques sphériques, ceci dépend de la fréquence d’analyse et de la géométrie de l’antenne de microphones.

Nous avons montré l’efficacité de notre méthode et avons mis en place une régularisation afin de limiter l’influence du bruit (présent sur les capteurs ou occasionné par des erreurs de position) sur notre algorithme.

Nous allons maintenant nous intéresser aux perspectives de ces algorithmes d’analyse de champs sonores. Un des défauts que nous pouvons reprocher à notre méthodes est son manque de flexibilité pour l’addition de contraintes supplémentaires lors de l’optimisation du vecteur de pondération, étant donné que seule une minimisation quadratique est envisageable. La flexibilité du traitement effectué dans les travaux de Yan [112] est un avantage dont nous aimerions profité aussi pour l’analyse de champs sonores, étant donné qu’il est possible de réaliser une minimisa-

tion de l’erreur en norme L∞, d’ajouter des contraintes supplémentaires. Ainsi, une perspective

intéressante semble d’envisager une méthode hybride d’analyse de champs sonores, réunissant les avantages des deux approches, discrètes et continues.

L’analyse effectuée par les antennes de microphones que nous avons utilisées au cours de ce chapitre est toujours localisée sur l’origine du repère. Il serait intéressant d’utiliser plusieurs antennes de microphones pour avoir plusieurs points de vue sur la scène sonore enregistrée.

Pour le moment, les algorithmes présentés dans ce chapitre permettent de faire des cartogra- phies de champ sonore à une fréquence d’analyse spécifique. Des exemples de telles cartographies de champ sonore sont disponibles au chapitre 7. Une des autres perspectives est de ne plus en- visager une formation de voies fréquentielle, mais globale, permettant de réaliser un filtre spatial sur une large bande de fréquences. Pour cela, il suffit de mettre en place un réseau de filtres sur l’antenne de microphones. Nous disposons de la réponse fréquentielle de ces filtres, et il ne nous reste plus qu’à implémenter un réseau de filtres FIR qui respecte au mieux ce gabarit afin de réa- liser cette fonction, et obtenir des représentations du champs sonores telles que celles utilisées par Caulkins et al. [23].

Pour le moment, ces algorithmes d’analyse de champs sonores peuvent être appliqués quel que soit l’antenne de microphones, et permettent d’aboutir à des prises de sons directives. La qualité de la représentation obtenue dépend du nombre de microphones utilisés lors de l’enregistrement et de leur répartition dans l’espace. Ces algorithmes peuvent être utilisés aussi bien pour des sys- tèmes de synthèse de champs sonore basés uniquement sur la représentation en ondes planes, mais peuvent être aussi utilisées comme systèmes de prise de son pour les dispositifs de Wave Field Synthesis. En effet, nous avions dit dans le bilan de la partie I qu’il n’existait pas encore de sys- tème performant de prise de sons lié à la Wave Field Synthesis, et que seule une solution hybride était envisageable dans l’état actuel des connaissances. Une telle solution hybride pourrait utiliser les algorithmes d’analyse de champs sonores présentés au cours de ce chapitre pour l’analyse de champs sonores réels captés par une antenne de microphones, et la Wave Field Synthesis comme procédé de synthèse de champs sonores.

Chapitre 6

Algorithmes pour la synthèse de

champs sonores

Résumé :

Dans la première partie de ce chapitre, nous introduisons les objectifs d’une égalisation multicanale idéale, dans laquelle le champ sonore serait connu idéalement. Nous insis- tons sur la difficulté théorique d’une telle approche, nécessitant la mise au point d’un opérateur d’inversion. Puis, nous simplifions la démarche de l’égalisation multicanale dans un contexte idéal afin que le calcul du réseau de filtres inverses à placer en amont du réseau de transducteurs soit réalisable en effectuant des calculs matriciels de façon à ce qu’il puisse être implémenté dans la pratique.

Nous introduisons deux structures pour le réseau de filtres inverses, la première ne pre- nant en compte que l’information récoltée sur le réseau de microphones, et la deuxième essayant d’optimiser le réseau de filtres inverses pour une source acoustique donnée.

Bien que la première approche soit plus complexe car elle nécessite Mmic fois plus de

calculs que la deuxième approche pour calculer le réseau de filtres inverses, elle per- met de reproduire n’importe quelle source. Ainsi, cette approche devient avantageuse lorsque le nombre de sources que nous souhaitons restituer devient supérieur au nombre de microphones utilisé pour caractériser le réseau de transducteurs.

L’algorithme de synthèse de champs sonore que nous présentons se découpe en deux par- ties. Dans un premier temps, nous calculons le gabarit optimal des filtres inverses dans le régime fréquentiel. Cette partie ne pose pas de difficulté du point de vue théorique. Dans un deuxième temps, les réponses impulsionnelles des filtres inverses, implémentés sous forme de filtres numériques à réponse impulsionnelle finie, sont calculées à partir de la connaissance de leur gabarit fréquentiel. Il s’agit d’un problème pour lesquelles il y a plus d’équations (nombre de fréquences où le gabarit des filtres inverses est connu) que d’inconnues (nombre de coefficients de chaque filtre inverse). De ce fait, nous cal- culons le réseau de filtres inverses qui approche au mieux le gabarit de référence au sens des moindres carrés. Étant donné que le calcul du réseau de filtres inverses peut exiger l’inversion d’une matrice dont les dimensions deviennent trop grandes pour être envi- sageable dans la pratique, nous avons mis en œuvre une procédure de calcul itérative convergeant en un faible nombre d’itérations vers la solution optimale. Il s’agit d’une résolution itérative par un algorithme de Gauss-Newton approché. Le calcul de chaque itération est accéléré en tirant profit de la structure de Toeplitz des matrices mises en jeu, de sorte que la FFT peut être utilisée pour calculer rapidement chaque itération.

Introduction

6.1 Introduction

Le chapitre précédent traitait des algorithmes permettant d’effectuer une analyse de champs sonores à partir d’un réseau de microphones. Le présent chapitre va s’occuper du problème dual, à savoir celui de la synthèse de champs sonores à partir d’un réseau de transducteurs.

Parmi les méthodes de synthèse de champs sonores existantes, nous pouvons citer :

– l’égalisation multicanale. Elle s’inspire des méthodes de reproductions binaurales, au casque, qui visent à reproduire la même valeur du champ de pression acoustique au niveau des tympans que le champ initial. L’égalisation multicanale possède les mêmes objectifs, excepté que la reproduction se fait à l’aide d’enceintes et non au casque. De fait, si le ca- nal gauche alimente l’enceinte gauche, et le canal droit l’enceinte droite, il y a naissance d’interférence car l’oreille droite entend une combinaison des deux canaux. Le principe de l’égalisation multicanale peut s’étendre sans problèmes pour un nombre de canaux supérieur à deux. Dans cette méthode, les opérateurs de propagation de chacun des transducteurs du réseau sont connus sur un ensemble de points. On met alors en place un réseau de filtres in- verses qui approche un opérateur de propagation cible, en minimisant l’erreur entre le champ de référence et le champ reconstruit. Cette méthode ne fait appel à aucune étape d’analyse du champ sonore intermédiaire. Les algorithmes utilisés sont des algorithmes d’égalisation multicanale. Des exemples de références associés à cette approche sont fournies dans les travaux suivants : Bouchard [15], Bouchard et Feng [16], Bouchard et Quednau [17], Cor- teel et al. [26], Elliott et al. [33], Guillaume et Grenier [40], Guillaume et al. [46], Kirkeby

et al.[56], Miyoshi et Kaneda [67], Nelson et al. [71, 72], Talantzis et Ward [98] ;

– la Wave Field Synthesis [8, 9, 10, 13, 14, 21, 26, 28, 29, 30, 49, 92, 93, 95]. Dans la pratique, il existe plusieurs variantes : la première consiste à considérer un réseau de transducteurs virtuel dont les positions coïncident avec celles des transducteurs réels. Généralement, les transducteurs sont alors supposés à directivité monopolaire ou dipolaire, mais ce n’est pas une obligation. Dans tous les cas, il est nécessaire d’adjoindre un modèle sur la directivité des transducteurs réels. La deuxième variante consiste à se ramener au cas de l’égalisation multicanale, mais en plaçant des garde-fous sur ce qui est physiquement réalisable, ce que ne font pas d’eux-mêmes les algorithmes d’égalisation multicanale ;

– des approches utilisant la formation de voies ont aussi été envisagées. Une des méthodes possibles est de filtrer le champ sonore dans chacune des directions où est présent un trans- ducteur, et d’alimenter le transducteur par le signal correspondant. Une méthode analogue était utilisée en utilisant la décomposition du champ sonore en harmoniques sphériques, dans les débuts des procédés ambisonics. Ces approches ne prennent pas en compte non plus le rayonnement réel des transducteurs ni leur interaction avec la salle hôte du dispositif de reproduction.

Dans ce chapitre, nous proposons un raffinement de l’algorithme d’égalisation multicanale que nous avons proposé à ICASSP [46]. Nous montrerons en particulier qu’il peut s’appliquer pour chacune des trois méthodes précédemment mentionnées. Un des points critiques dans le calcul du réseau de filtres inverses, qui est un ensemble de filtres numériques à réponse impulsionnelle finie, est le retour dans le domaine temporel. En effet, toutes les méthodes d’analyse que nous avons pré- sentées dans le chapitre précédent se situaient dans le domaine fréquentiel. Cette présentation dans le domaine fréquentiel est beaucoup plus adaptée pour l’analyse. En revanche, passer directement du domaine fréquentiel au domaine temporel par simple FFT inverse souffre des inconvénients de la convolution circulaire. Il faut réaliser un compromis entre les effets néfastes de la convolution circulaire, qui introduit du repliement dans le domaine temporel, et la complexité de calcul. En effet, dès que le nombre de transducteurs ou de signaux de consigne tend à grimper, tout comme le nombre de coefficients des filtres inverses, une formulation du problème uniquement dans le

Contextes des différents algorithmes d’égalisation multicanale

domaine temporel devient ingérable. Plusieurs méthodes ont été mises en place pour pallier ce problème en utilisant la FFT, notamment le recours à une régularisation.

Nous utilisons une formulation dans le domaine temporel, et nous proposons un algorithme itératif effectuant les calculs dans le domaine fréquentiel afin d’avoir des bonnes propriétés en terme de complexité. De plus, nous appliquons l’algorithme pour chacune des méthodes envisa- gées ci-dessus, et non plus uniquement l’égalisation multicanale traditionnelle.

6.2 Contextes des différents algorithmes d’égalisation multicanale

Dans le document Analysis and synthesis of sound fields (Page 132-137)