• Aucun résultat trouvé

Mod´elisation des sons d’instrument de musique

A.10 Applications

A.10.1 Mod´elisation des sons d’instrument de musique

Le but de l’exp´erience en ce qui concerne l’instrument des sons musicaux est de comparer la pr´ecision de la mod´elisation de la SM, EDS, et eaQHM pour un large ´eventail de sons d’instruments de musique, y compris de per- cussion et nonpercussive. Dans ce travail, la pr´ecision de la mod´elisation est mesur´ee par l’es srer locale et globale, calcul´ee en utilisant l’´equation (A.92) :

SRER = 20 log10

σx(t)

σx(t)−ˆx(t)

(A.92) Le SRER locale est mesur´ee sur une fenˆetre juste avant le d´ebut d’´evaluer l’´etalement de l’attaque ´egalement connu sous le nom de pr´e-´echo, un artefact tr`es fr´equent chez les mod`eles qui utilisent des sinuso¨ıdes sinuso¨ıdale quasi-stationnaires. Le SRER mondiale mesure la pr´ecision globale de la mod´elisation, de prendre toute son compte.

La pr´ecision de la mod´elisation d´epend du nombre de partielsK et la taille de la fenˆetre L pour les algorithmes sinuso¨ıdales. Traditionnellement, les partiels ne sont pas suppos´es varier beaucoup `a l’int´erieur de la fenˆetre d’analyse, et donc sont mod´elis´es avec des sinuso¨ıdes quasi-stationnaires dont les param`etres sont en moyenne sur la fenˆetre, le

changement entre les fenˆetres en fonction de la taille de pas. D’autre part, en supposant que chaque sinuso¨ıde une capture partielle, il existe un nombre minimum de sinuso¨ıdes n´ecessaires pour repr´esenter l’´energie d’oscillation dans un instrument de musique retentit. Ainsi, nous allons pr´esenter une comparaison de l’es srer en fonction deK et L pour le SM, EDS, et eaQHM. Tout d’abord, nous d´ecrivons l’instrument de musique mod´elis´ee sons et la s´election de valeurs de param`etres pour des algorithmes.

Au total, les sons d’instruments90 musicales ont ´et´e utilis´ees dans ce travail1.

Configuration exp´erimentale

L’estimation des param`etres de la SM suit [MQ86] avec interpolation de phase par splines cubiques. L’estimation des param`etres pour EDS utilis´ee ici est d´ecrite en d´etail ailleurs [DBR13], alors que l’estimation du nombre optimal de pˆoles (sinuso¨ıdes) [BDR04] est utilis´e pour la comparaison. Dans toutes les exp´eriences, le seuil de convergence es srer est d´efini sur 0.01, la taille de la FFT est N = 4096 ´echantillons, et la fr´equence d’´echantillonnage pour tous les sons estfs = 16 kHz. La taille de l’´etape de la SM et eaQHM ´etait H = 1 ms (ce qui correspond `a 16 ´echantillons). EDS

estime les param`etres s´epar´ement pour les cadres non-chevauchement (fenˆetre rectangulaire) de tailleL. Pour chaque ´etape d’estimation de param`etres, EDS d´ecompose le cadre deL/2 et utilise une taille de l’´echantillon hop H = 1 lors de la construction de la matrice de Hankel [DBR13]. Avant de mod´elisation avec le SM, EDS, et le eaQHM, la fr´equence fondamentalef0de tous les sons a ´et´e estim´ee `a l’aide SWIPE [CH08] parce que dans ce travail, la taille de la fenˆetreL

et le nombre maximum de sinuso¨ıdale partiels Kmaxen supposant harmonicit´e d´ependentf0.

R´esultats

Le nombre de (sinuso¨ıdale) partiels K est un param`etre d’entr´ee importante qui influe directement sur la pr´ecision de la mod´elisation de la SM, EDS, et le eaQHM. Nous avons couru chaque algorithme avec diff´erents num´eros de partiels comme param`etre d’entr´ee (la taille de la fenˆetre a ´et´e maintenue `aL = 3T0) et enregistr´e les valeurs es srer locales

et globales r´esultant. Nous avons commenc´e `a partir deKmaxet une diminution deK par 2 partiels. Nous nous atten-

dions `a la SM de converger rapidement vers une valeur maximale et `a stabiliser `a cause de l’algorithme de s´election de param`etre. La litt´erature sur EDS [BDR04] sugg`ere qu’il existe un nombre optimal de partiels pour l’audio, donc nous nous attendions `a EDS de rendre une courbe qui devrait atteindre un maximum autour de ce point, puis diminuer. Enfin, l’adaptation permet la eaQHM pour repr´esenter les petites variations temporelles telles que les ph´enom`enes transitoires pr´ecis´ement que les modulations d’amplitude et de la fr´equence des partiels (peu importe le nombre de partiels). Par cons´equent, nous nous attendions `a ce qui a donn´e le eaQHM valeurs plus ´elev´ees de es srer comme le nombre de par- tiels augment´ee.

Table A.5 montre la diff´erence de SRER moyenne entre eaQHM et EDS et eaQHM et SM pour les instruments de musique regroup´es en familles. La rang´ee du bas montre la moyenne de tous les instruments marqu´es total. Les colonnes marqu´ees locale et global pr´esente la diff´erence entreK, tandis que la colonne intitul´ee Kmaxmontre la diff´erence de

SRER global que pour le nombre maximum de partiels. S’il vous plaˆıt noter que la taille de la fenˆetre est constante `a 3T0. La taille de la fenˆetreL affecte ´egalement directement la pr´ecision de la mod´elisation de la SM, EDS, et la eaQHM.

Nous avons couru chaque algorithme variableL de 3T0`a8T0avec un nombre constant de partielsKmaxet mesur´e l’es

srer local et global qui en r´esulte. Nous nous attendions `aL un impact n´egatif sur les trois algorithmes diff´eremment. Nous nous attendions `aL pour avoir un plus grand impact sur le SM parce que les deux l’estimation des param`etres et la r´esolution temporelle d´ependent deL. Nous nous attendions `a L pour avoir un impact plus faible sur la pr´ecision de la mod´elisation pour EDS en raison de l’amplitude variant dans le temps des sinuso¨ıdes localement stationnaires (en d´epit de la valeur de fr´equence constante `a l’int´erieur de la fenˆetre.) Enfin, nous conjectur´e que L aura un mineur effet sur la eaQHM affecte principalement parceL de la capacit´e de la eaQHM pour capturer des modulations d’amplitude et de fr´equence `a l’int´erieur de la fenˆetre.

Table A.6 montre la diff´erence de es srer moyenne entre eaQHM et EDS et eaQHM et SM. Le locales et globales colonnes pr´esentent la diff´erence moyenne de es srer surL, tandis que la colonne 3T0montre la diff´erence de SRER

globalpour la taille de la fenˆetre qui donne la meilleure pr´ecision de la mod´elisation pour tous les algorithmes. Le SRER local est utilis´e pour ´evaluer la pr´ecision de la mod´elisation apparition et es srer mondiale ´evalue la performance g´en´erale. La colonne3T0 sera utilis´e comme mesure de r´ef´erence par famille d’instruments de musique et la ligne total comme

r´ef´erence par mod`ele. Enfin, le nombre d’adaptation est ´etudi´ee pour la eaQHM. On observe que les augmentations de

1‘Popular’ and ‘Keyboard’ musical instruments are from the RWC Music Database : Musical Instrument Soundhttp://staff.aist.go.jp/

m.goto/RWC-MDB/. Tous les autres instruments de musique sont la base de donn´ees Vienna Symphonic Library d’´echantillons d’instruments de musiquehttp://www.vsl.co.at/en/65/71/84/1349.vsl

SRER(eaQHM-EDS) SRER(eaQHM-SM) Local Global Kmax Local Global Kmax

Brass 7.69 9.22 7.48 22.44 9.05 5.41 Woodwinds 2.95 6.90 19.60 17.21 12.18 29.93 Bowed Strings 6.32 3.45 21.52 14.46 6.06 31.21 Plucked Strings 13.26 11.96 15.75 24.69 25.63 42.99 Bowed Percus- sion -3.89 2.00 21.80 2.65 10.56 37.63 Struck Percus- sion 2.83 -1.52 11.88 7.68 2.77 21.06 Popular 1.09 -0.44 11.93 3.55 -1.21 18.09 Keyboard 6.33 4.41 3.15 16.99 11.87 24.79 Total 4.55 4.50 14.14 14.15 9.07 26.39

TABLEA.5 – Diff´erence moyenne de SRER (dB) entre eaQHM et EDS ou SM `a travers le nombre de partielsK.

SRER(eaQHM-EDS) SRER(eaQHM-SM) Local Global 3T0 Local Global 3T0

Brass -3.07 10.74 27.27 12.20 14.75 31.19 Woodwinds -2.81 6.92 18.21 11.63 13.43 30.44 Bowed Strings 3.01 7.55 28.11 10.85 12.62 38.18 Plucked Strings -12.38 -15.89 7.78 21.16 17.57 49.88 Bowed Percus- sion -4.26 6.86 21.80 10.83 15.85 37.63 Struck Percus- sion 8.13 5.85 10.82 15.24 11.73 19.25 Popular -0.91 5.57 15.25 9.00 9.02 21.91 Keyboard -4.25 -4.02 3.15 12.90 10.60 24.79 Total -2.30 2.95 16.55 12.46 12.78 31.66

TABLEA.6 – Diff´erence moyenne de SRER (dB) entre la eaQHM et EDS ou SM dans la taille de fenˆetreL.

SRER est rapidement apr`es quelques adaptations, convergeant lentement `a une valeur finale de plusieurs ordres de gran- deur plus ´elev´e qu’avant l’adaptation.

Ce travail a propos´e d’utiliser un mod`ele sinuso¨ıdal adaptatif surnomm´e eaQHM pour repr´esenter un instrument de musique `a percussion et nonpercussive sonne comme sinuso¨ıdes modul´ees en amplitude et en fr´equence. En g´en´eral, la eaQHM rend encore repr´esentation compacte de haute qualit´e avec des param`etres intuitifs. Le mod`ele repr´esente onsets bien nettes avec transitoires d’attaque, spectres inharmoniques, et mˆeme les bruits m´ecaniques.

Dans l’ensemble, les r´esultats ont montr´e que la eaQHM surpasse EDS et SM en moyenne, dans les deux variantes dans tous les cas, sauf pour l’es srer locale sous EDS variation de taille de la fenˆetre. Consid´erant que la taille de la fenˆetre et le nombre de partiels dont les algorithmes effectuent leur mieux, le eaQHM a toujours d´epass´e EDS de plus de 10 dB et SM de plus de 25 dB en moyenne.