• Aucun résultat trouvé

Résultats des tests sur les phases du modèle d’analyse-synthèse

5.3 Tests MUSHRA et RSB effectués sur le modèle d’analyse-synthèse

5.3.4 Résultats des tests sur les phases du modèle d’analyse-synthèse

Cette section donne les détails de la deuxième partie du test MUSHRA qui évalue la méthode de réduction des phases du modèle d’analyse-synthèse. La méthode pour la ré- duction du nombre de phases transmis n’influence pas sur le nombre de phases dans le spectre de synthèse. Pour les phases non transmises, le modèle applique une extrapolation des valeurs des phases par rotation pour les anciens partiels ou leur attribue des valeurs aléatoires pour les phases provenant de nouveaux partiels. La section 4.3.1 du chapitre 4 donne tous les détails pour la méthode de réduction de phases transmises.

Afin d’approfondir les connaissances des phases dans le modèle, des études ont été effec- tuées sur l’importance des phases sur la qualité du signal de synthèse. La prochaine section donne les détails des observations sur le comportement des phases dans le modèle.

Analyse sur la cohérence des phases entre les trames

L’objectif de l’étude des phases consiste à déterminer leur importance sur la qualité du signal de synthèse dans le modèle. Pour déterminer ce niveau d’importance, le modèle diminue au maximum le nombre de phases transmises au décodeur tout en tentant de conserver un signal de synthèse de qualité.

Après quelques tests non formels, les résultats démontrent que le modèle nécessite peu de phases originales pour obtenir un signal de synthèse de qualité. Pour démontrer ce concept, le modèle utilise un nombre restreint de phases afin de mieux comprendre les limites du modèle. Ainsi, le tableau 5.2 des stimuli montre que le modèle utilise un stimulus avec 2 phases originales et deux stimuli avec 0 phase originale afin de créer les spectres de synthèse.

Avec le stimulus modèle AS-0ϕ, le modèle tente l’expérience plus loin en ne transmet- tant aucune valeur de phase au décodeur. Pour la création du spectre de synthèse, le décodeur crée des valeurs de phases aléatoires pour les nouveaux partiels et applique une extrapolation par rotation des phases pour les anciens partiels.

Cependant, les nombreuses écoutes de fichiers démontrent la présence d’artéfacts audibles à des endroits précis dans le stimulus modèle AS-0ϕ et qui n’existent pas dans le signal du stimulus modèle AS-2ϕ avec 2 phases originales. La figure 5.10 montre l’exemple d’un segment de synthèse avec un artéfact audible qui s’entend uniquement dans le stimulus modèle AS-0ϕ avec aucune phase.

D’ANALYSE-SYNTHÈSE 133 0 23 46 −23 −46 12 24 36 48 60 Amplitude (×102)

(a) Signal original dans le domaine temporel

0 23 46 −23 −46 12 24 36 48 60 Amplitude (×102)

(b) Signal du stimulus modèle AS-2ϕ avec 2 phases originales

0 23 46 −23 −46 12 24 36 48 60 Amplitude (×102)

(c) Signal du stimulus modèle AS-0ϕ avec aucune phase originale

Figure 5.10 Signaux de synthèse avec un nombre différent de phases originales

L’observation des différents signaux de la figure 5.10 ne démontre pas l’évidence flagrante d’un artéfact audible. Toutefois, l’utilisation d’un filtre passe-bas à 200 Hz sur les mêmes signaux de la figure 5.10 démontre la présence d’une discontinuité visible et audible dans le stimulus modèle AS-0ϕ avec aucune phase (cf. figure 5.11).

Après de nombreuses observations et d’écoute de fichiers, il a été constaté que ces disconti- nuités surviennent lors d’un changement d’état bien précis du classificateur. La figure 5.12 montre que les discontinuités se produisent lorsque le classificateur déclare une trame non- harmonique entre deux trames mixtes. Il est important de mentionner que la déclaration de cette trame non-harmonique ne provient pas d’une erreur de classification, car selon les spécifications actuelles, le classificateur devait déclarer cette analyse non-harmonique. La situation de la figure 5.12 entraîne une discontinuité de phases, car la trame mixte à t + 1 qui suit la trame non-harmonique t possède des phases aléatoires qui ne sont plus cohérentes avec les anciennes phases des trames t − 1 et t − 2. Par conséquent, ce manque de cohérence des valeurs des phases entraîne des discontinuités audibles. Afin de valider

0 405 810 −405 −810 12 24 36 48 60 Amplitudes

(a) Signal du stimulus modèle AS-2ϕ filtré passe-bas (200 Hz) avec 2 phases originales

0 405 810 −405 −810 12 24 36 48 60 Amplitudes

(b) Signal du stimulus modèle AS-0ϕ filtré passe-bas (200 Hz) avec aucune phase originale Figure 5.11 Signaux de la figure 5.10 filtrés passe-bas à 200 Hz

mixte mixte non harm. mixte

t − 2 t − 1 t t + 1

Figure 5.12 Schéma des endroits où se produisent les discontinuités

l’importance de la cohérence des phases entre les trames, un algorithme a été développé pour la gestion des états de discontinuités de la figure 5.12.

L’algorithme proposé prolonge les segments mixtes d’une longueur de trame de 12 ms. La figure 5.13 montre que durant une transition entre une trame mixte et une trame non-harmonique, l’algorithme recopie les informations harmoniques de la trame mixte précédente t − 1 à la trame non-harmonique t afin de s’assurer une meilleure continuité entre les trames. Ainsi, la trame non-harmonique t devient un trame mixte t comme le montre la figure 5.13 .

L’algorithme s’utilise uniquement pour la première trame déclarée non-harmonique suivant une trame mixte, ce qui assure que le signal de synthèse ne possède pas un son trop synthétique. La figure 5.14(c) montre l’usage de l’algorithme sur le stimulus modèle AS-0ϕ filtré passe-bas à 200 Hz.

La figure 5.14(c) montre que l’algorithme élimine les discontinuités entre les trames. Lors de l’écoute des signaux de synthèse, les artéfacts audibles auparavant n’apparaissent plus lors de l’écoute. La prochaine partie montre les résultats obtenus du test MUSHRA avec le concept des phases.

D’ANALYSE-SYNTHÈSE 135

mixte mixte n-harm mixte

t − 2 t − 1 t t + 1

Application de l’algorithme des phases

mixte mixte mixte mixte

t − 2 t − 1 t t + 1

Figure 5.13 Schéma de fonctionnement de l’algorithme développé pour les phases 0 405 810 −405 −810 12 24 36 48 60 Amplitudes

(a) Signal du stimulus modèle AS-2ϕ filtré passe-bas (200 Hz) avec 2 phases originales

0 405 810 −405 −810 12 24 36 48 60 Amplitudes

(b) Signal du stimulus modèle AS-0ϕ filtré passe-bas (200 Hz) avec aucune phase originale

0 405 810 −405 −810 12 24 36 48 60 Amplitudes

(c) Signal du stimulus modèle AS-Algo filtré passe-bas (200 Hz) avec aucune phase originale et ajout de l’algorithme

Figure 5.14 Résultat avec l’ajout de l’algorithme pour le signal 5.14(c) Résultats des tests

La figure 5.15 montre les résultats MUSHRA pour la méthode des phases ainsi que les valeurs RSB segmentaires de chaque stimulus. Le calcul des valeurs RSB segmentaires ont

été effectués avec les mêmes équations 5.2 et 5.3 de la section 5.3.3. Ainsi, une valeur RSB élevée indique que le signal de synthèse est peu bruité tandis qu’une valeur de RSB faible signifie un signal de synthèse avec un niveau de bruit élevé comparativement au signal original.

La figure 5.15 montre les résultats obtenus pour les valeurs RSB segmentaires et les scores moyens MUSHRA de chacun des stimuli sur un total de 80 scores. Les valeurs RSB seg- mentaires de la figure 5.15 ont été normalisées de 0% à 100% en fonction du signal original qui lui possède une valeur RSB de 100%.

0 20 40 60 80 100 Excellent Bon Assez bon Médiocre Mauvais 54.72 16.63 11.91 5.97 5.02 28.10 89.67 80.58 68.75 75.83

Différentes versions du modèle d’analyse-synthèse

Original Repère Modèle

AS ModèleAS-2ϕ ModèleAS-0ϕ AS-AlgoModèle

Résultats pour le RSB segmentaire (%) Résultats pour le MUSHRA (%)

Figure 5.15 Résultats des tests RSB et MUSHRA avec différentes versions du modèle

Analyse des résultats

La figure 5.15 montre qu’il existe de grands écarts entre les résultats de tests objectifs (valeurs RSB segmentaires) et les résultats de tests subjectifs (valeurs MUSHRA) des stimuli. Cette première observation démontre que le modèle de codage par transformée réussit à obtenir un signal de qualité de bon à excellent sans nécessairement suivre la forme d’onde du signal original.

De plus, la figure 5.15 montre également que le stimulus avec uniquement 2 phases trans- mises réussit également à obtenir un signal de synthèse avec une bonne qualité tout en

allant plus loin dans l’abstraction de la forme d’onde du signal original. Les résultats du stimulus avec 2 phases et celui avec 0 phase transmise démontrent l’importance qu’il faut transmettre un minimum de phases pour obtenir un signal de synthèse de qualité. L’ap- pareil auditif humain possède une grande sensibilité en basse fréquence, mais semble par la suite peu sensible sur l’exactitude des valeurs pour les phases.

Cette hypothèse de l’importance de la cohérence et non de la valeur absolue pour les phases se confirme par le stimulus qui ne contient aucune phase transmise, mais qui intègre l’algorithme de recouvrement des discontinuités de la section 5.3.4. Les résultats de la figure 5.15 montrent que le stimulus avec l’algorithme réussit à améliorer le signal de synthèse comparativement au stimulus qui n’utilise aucune phase.