• Aucun résultat trouvé

Comparaison des modèles de haut-parleurs

A.3 Modélisation de distorsion nonlinéaire

A.3.1 Comparaison des modèles de haut-parleurs

Il y a un manque de théorie unique pour modéliser et caractériser un haut-parleur nonlinéaire. Toute recherche dans NAEC dépend de la précision du modèle de haut-parleur, qu’il soit utilisé pour NAEC lui-même, ou pour synthétiser artificiellement des signaux de test nonlinéaires. Alors que l’approche série-puissance (PSM) offre généralement des performances NAEC efficaces dans des simulations bien contrôlées, même de légères inexactitudes de modèle ont tendance à dégrader les performances dans des conditions réelles. Le modèle polynomial généralisé de Hammerstein (GPHM) a donc été étudié comme un modèle alternatif. Une question se pose maintenant en ce qui concerne la précision du modèle: quel modèle reflète le mieux la distorsion nonlinéaire réelle du haut-parleur? Cette section étudie la possibilité de la modélisation de distorsion de haut-parleur nonlinéaire avec PSM. En outre, la précision des deux modèles est comparée dans l’estimation des sorties de haut-parleurs réels mesurés empiriquement.

Les résultats sont publiés dans notre premier article [56].

PC + External Sound Card

Network Simulator (CMU)

Mobile Device

Figure A.7 – Configuration expérimentale utilisée pour l’identification d’un réel haut-parleur de téléphonie mobile

La configuration expérimentale utilisée pour l’identification des haut-parleurs de télé-phones mobiles est illustrée sur la figure A.7. Un appareil mobile est placé devant un mannequin de tête et de torse à une distance de 32 cm. L’appareil est configuré pour fonctionner en mode mains libres et au volume maximal pour lequel une distorsion nonlinéaire est assurée. Un signal sinusoïdal exponentiel (en utilisant l’équation 3.6 avec amplitudea(n) = 1, fréquences f1= 20Hzet f2 = 4kHz échantillonné à 8kHz) est joué par le téléphone mobile haut-parleur et enregistré avec le microphone monté dans l’oreille d’un mannequin. Les noyaux Volterra simplifiés hp, pœ[1, P] d’un véritable haut-parleur

de téléphone portable sont calculés expérimentalement en utilisant le signal de balayage sinusoïdal exponentiel (chirp) basé sur la technique de convolution nonlinéaire [7, 17].

Les détails sur la technique de convolution nonlinéaire et la procédure expérimentale d’identification des noyaux Volterra simplifiés sont décrits dans la section 3.3 et la section 4.1 respectivement.

Génération de signaux synthétiques

Tout d’abord, un signal vocal propre x(n) est joué par le haut-parleur de l’appareil mobile et ensuite enregistré à l’oreille du mannequin en utilisant la même configuration expérimentale représentée sur la figure [A]. Nous appelons le signal vocal enregistré empiriquement xreal(n). Maintenant, en utilisant le même signal de parole proprex(n), les signaux de sortie de haut-parleur synthétisésxout(n) sont calculés pour PSM et GPHM en utilisant les équations A.3 et A.4 respectivement.

Pour le GPHM, nous avons utilisé les noyaux de Volterra diagonaux simplifiés hp, pœ [1, P] mesurés empiriquement à partir d’un haut-parleur de téléphone portable comme décrit dans la section précédente pour la génération de signal . Nous avons considéré les noyaux d’ordre P = 5 chacun de longueurL= 256 taps, car ils sont plus dominants que les autres nonlinéarités d’ordre supérieur.

Pour le PSM, nous définissons le gain a1 = 1. À des fins de comparaison, nous avons également utilisé 5th order PSM ici. Les composantes de pondérationap pourpœ[2,5]

sont choisies de sorte que la quantité totale de distorsion nonlinéaire soit la même que celle du GPHM.

Évaluation

Le signal vocal enregistré à l’oreille du mannequin (xreal(n)) a été comparé aux résultats obtenus selon les deux modèles. Les spectrogrammes du signal de parole propre d’entrée, une réponse de haut-parleur de téléphone mobile, et les deux signaux synthétisés sont illustrés sur la Fig. A.8. Il est évident à partir de la figure que le signal synthétisé avec le GPHM est plus identique au signal vocal réel enregistré (ou mesuré). Le modèle de série de puissance suppose une réponse en fréquence plate qu’un haut-parleur linéaire IR n’a pas, ce qui explique la différence dans le mécanisme de distorsion par rapport au signal réel enregistré. Sans surprise, le signal synthétisé avec le PSM a plus d’énergie aux basses fréquences comme le signal de parole propre original qui ne sont pas réellement présents dans le signal enregistré réel. Le signal enregistré réel a plus d’énergie dans la région haute fréquence (≥Ø 1500) en raison de la distorsion nonlinéaire que le signal

Time

Figure A.8 – Le spectrogramme de (a) signal de parole propre (b) une réponse de haut-parleur de téléphone mobile réel (c) signal de parole synthétisé utilisant PSM (d) signal de parole synthétisé utilisant GPHM

0 1 2 3 4 5 6

Figure A.9 – Une illustration de la distance cepstrale entre les signaux de haut-parleurs mesurés réels et ceux synthétisés avec les modèles PSM et GPHM.

En outre, la performance est également évaluée objectivement en termes de distance Cepstral (CD):

CD(m) =Ûÿ

Lf

[Cxreal(m)≠Cxmodel(m)]2 (A.5)

Lf est la longueur de la trame. Cxreal(m) et Cxmodel(m) sont les vecteurs de colonne des coefficients cepstraux à partir du signal réel enregistré xreal et du modèle xmodel de la framemth respectivement.

Cxreal(m) =IDF T{ln|DF T[xreal(mLf ≠1)· · ·xreal((m+ 1)Lf)]|} (A.6) Dans tous les cas, les mesures proviennent de trames consécutives de 32ms(Lf = 256) de longueur. La raison pour laquelle CD est cela, il fournit une évaluation plus corrélée perceptuellement que les approches alternatives basées sur les différences d’énergie ou de puissance. Les profils CD illustrés sur la figure Fig. A.9 montrent que la différence entre le signal mesuré et celui synthétisé avec le modèle GPHM est toujours inférieure à celle entre le signal mesuré et le signal synthétisé avec le modèle PSM. Le modèle GPHM reflète donc mieux le comportement du vrai haut-parleur nonlinéaire.

Ce résultat a également été confirmé par de nombreux tests d’écoute informels qui ont montré que les signaux synthétisés avec le modèle GPHM semblent moins artificiels et sont perceptivement plus proches du signal mesuré que ceux synthétisés avec le modèle de série de puissance.

A.3.2 Impact des signaux d’écho nonlinéaires simulés sur l’évaluation