• Aucun résultat trouvé

Chapitre VI. Performances du modèle DESQHI

VI.2. Performance du modèle DESQHI sur des bases sonores inconnues

VI.2.2. Base sonore bruitée

La base sonore bruitée de Gautier-Turbin et Gros [92] est appliquée au modèle DESQHI. Cette base sonore a déjà été utilisée lors de la validation du modèle de bruyance (cf. §.IV.4.2). Dans l’étude précédente, cette base sonore avait été utilisée en séparant les condi-tions de dégradation selon les différents algorithmes de débruitage. Cette distinction avait été faite car le modèle de bruyance ne prend pas en compte les dégradations présentes sur le si-gnal de parole qui sont provoquées par l’utilisation de l’algorithme de débruitage.

Dans cette partie, la totalité de la base sonore est appliquée au modèle DESQHI, afin de tester les performances de prédiction de la qualité vocale en présence de dégradations rela-tives à différents types de bruits de fond et des dégradations de la parole causées par l’utilisation des algorithmes de débruitage de la parole.

Les performances de DESQHI sont présentées pour quatre versions différentes (cf. Tab. VI.8). Codage Continuité Paramétrique Signal r EAM r EAM Paramétrique 0,22 0,61 0,53 0,53 Signal 0,63 0,49 0,69 0,45

Tab. VI.8 Performances des différentes versions du modèle DESQHI sur la base sonore bruitée [92], à partir des coefficients de corrélation r et des erreurs absolues moyennes EAM entre les MOS-LQSN et les

MOS-LQON. La dimension bruyance est représentée par des indicateurs basés sur le signal. Les performances de DESQHI montrent en général que les indicateurs utilisant au moins un indicateur paramétrique ne sont pas adaptés aux dégradations présentes dans cette base sonore (pas de perte de paquets, ni d’erreur de bit, ni de dégradation liée au codage de la parole). Cependant, les indicateurs basés sur le signal des trois dimensions perceptives du modèle DESQHI (bruyance, codage de la parole et continuité) permettent de mettre en évi-dence les dégradations présentes sur ces stimuli, qui sont causées par l’utilisation des algo-rithmes de débruitage de la parole. Le modèle DESQHI dans sa version entièrement basée sur le signal obtient une performance de r = 0,69 (cf. Tab. VI.8 et Fig. VI.6).

Le modèle P.563 (basé sur le signal) n’est pas adapté à ce type de dégradation. Il obtient une performance de r = 0,32 / EAM = 0,62 (cf. Fig. VI.6). Le modèle E (paramétrique) est inutilisable pour cette base sonore car les dégradations présentes dans cette base sonore ne sont pas disponibles dans les statistiques du réseau (bruit de fond et algorithme de débrui-tage).

Fig. VI.6 Comparaison des performances de la prédiction de la qualité vocale entre le modèle DESQHI basé sur le signal (à gauche) et le modèle P.563 (à droite)

Les dégradations produites par l’utilisation des algorithmes de débruitage sont prises en compte par le modèle DESQHI dans sa version entièrement basée sur le signal. Ce résultat montre que ce modèle peut être appliqué à des dégradations qui n’ont pas été prises en compte lors de sa construction. Cela confirme que la structure tridimensionnelle du modèle DESQHI est bien adaptée à l’évaluation de la qualité vocale en présence de diverses dégradations pré-sentes lors d’une communication téléphonique.

Les performances de la classification automatique du bruit de fond ont été mesurées en considérant que le bruit de rue est un bruit de souffle car il serait certainement classifié en tant que tel lors d’un test subjectif (bruit de vent qui souffle). Le bruit de bureau ressemble à un bruit rose, il est considéré comme du bruit de souffle. Le bruit de foule correspond à un bruit

d’environnement. Les résultats de la classification montrent d’excellentes performances avec seulement 7 erreurs sur 96 stimuli (7,3 % d’erreur de classification). Certains bruits de fond constitués initialement de bruit d’environnement (bruit de foule), sont identifiés comme du bruit de souffle car l’algorithme de débruitage modifie le bruit. Trois "erreurs" comptabilisées appartiennent à ce cas.

Lorsque l’algorithme de débruitage est appliqué au niveau "agressif" (cf. §.IV.4.2), il apparaît des dégradations sur le signal de parole. Il se peut qu’en voulant supprimer un bruit d’environnement qui n’est pas forcément gênant, les outils de débruitage génèrent d’autres dégradations qui peuvent être encore plus gênantes. Pour cela, un exemple de diagnostic est donné dans cette partie pour quatre conditions plus ou moins débruitées, dans le cas de la voix d’homme en présence du bruit de foule.

Fig. VI.7 Diagnostic de la qualité vocale (DESQHI basé sur le signal) de 4 conditions débruitées par les 2 algorithmes de débruitage utilisés de manière légère (DB1 et DB3) et agressive (DB2 et DB4). Le bruit de fond est celui de foule diffusé au niveau faible (RSB = 20 dB). Les 3 barres correspondent respectivement

au RMOS de la bruyance, du codage de la parole et de la continuité. Les MOS-LQON prédites par DESQHI sont présentées en rouge (*), et les MOS-LQSN le sont en bleu (*).

On remarque pour ces quatre conditions que le deuxième algorithme de débruitage (DB3 et DB4) provoque de la discontinuité sur le signal, contrairement au premier algorithme de débruitage (DB1 et DB2). Cela se répercute sur les notes MOS-LQON et MOS-LQSN. L’utilisation des algorithmes de débruitage agressifs (DB2 et DB4) améliore les notes rela-tives à la bruyance, par rapport à l’utilisation des algorithmes légers (DB1 et DB3). Dans le cas du premier algorithme de débruitage, il n’y a pas d’impact sur les autres RMOS relatives au codage de la parole et à la continuité. Dans le cas du deuxième algorithme de débruitage, nous remarquons une diminution de la RMOS liée à la continuité. L’application de cet algo-rithme agressif à ce stimulus réduit donc le niveau sonore du bruit de fond, ce qui entraîne une amélioration de la RMOS de la bruyance, au détriment de la RMOS liée à l’ajout de disconti-nuité sur le signal.

Le diagnostic de la qualité vocale offre de nombreuses perspectives afin d’approfondir les diverses analyses de l’évaluation de la qualité vocale d’une transmission téléphonique.