• Aucun résultat trouvé

4. EVALUATION DE LA QUALITE AUDIO SUIVANT LES DIFFERENTES

4.5 EVALUATION DE LA QUALITE DE SIGNAUX DE PAROLE BINAURAUX MULTI-

4.5.4 Les auditeurs

4.5.6.2 Résultats wideband de la session de spatialisation

Nous comparons les deux types de configuration angulaire sur les résultats de la session spatiali- sation du test wideband, Figure 4.42 :

Boîte à moustaches: Notes

Moyenne Moyenne±Erreur-Type Moyenne±1,96*Erreur-Type OPP NON_OPP Cat_Angles 0 20 40 60 80 100 N o te s

Figure 4.42 Comparaison des deux types de configuration angulaire sur les résultats de la session de quali- té de spatialisation du test wideband

Un t-test a montré que les deux groupes d'angles ont obtenu des résultats similaires (t(628)=1.15, p= 0,25).

Nous présentons sur la Figure 4.43, les résultats obtenus pour les différents codeurs. Codeurs; Moy. Pondérées

Effet courant : F(6, --)=91,629, p=0,0000 Décomposition de Type III

Les barres verticales représentent les intervalles de confiance à 0,95

67,83 42,18 87,76 3,30 65,12 41,11 AMRWB 23.85 SPAT AMRWB 12.65 SPAT G.722 SPAT Ori_SPAT

Ref AMRWB 6.60 SPAT

G.729.1 32 SPAT G.729.1 16 SPAT Codeurs 0 10 20 30 40 50 60 70 80 90 100 N o te s

Figure 4.43 Résultats des codeurs wideband tous angles confondus pour la session de qualité de spatiali- sation

On peut remarquer que les références haute (la condition n°1) et basse (la condition n°7) sont bien retrouvées par les sujets. Pour une même famille de codeurs, les codeurs haut-débit sont mieux notés que les bas-débit.

On peut remarquer qu'un seul codeur a une spatialisation jugée excellente : le codeur G.722. Les codeurs haut-débit ont quant à eux une spatialisation jugée bonne. Tous les autres codeurs ont une qualité jugée au mieux passable.

Une analyse de variance a confirmé l'effet significatif (p<0.05) du codage mais aussi de la combinaison d'angles et cette fois des sujets.

Facteurs Degrés de liberté F-ratio p =Significativité

Codeurs 6 91.6292 0.00

Combinaison d'angles 9 3.1395 0.00

Sujets 8 5.0373 0.00

Codeurs* Combinaison d'angles 54 1.5645 0.01

Tableau 4.41 Effets des différents facteurs pour le test de conférence narrowband pour la ses- sion de qualité de spatialisation du test narrowband.

Le test HSD de Tukey effectué sur ces données a montré que certains codeurs étaient équivalents. Le classement d'équivalence des codeurs est donc :

N° Codeurs 1 Ori 2 G.722 3 G.729.1 32  AMR-WB 23.85 4 G.729.1 16  AMR-WB 12.65 5 Ref AMR-WB 6.60

Tableau 4.42 Classement des codeurs narrowband tous angles confondus pour la session qualité de spatialisation

On obtient deux classes d'équivalence entre d'une part les codeurs CELP haut-débit et d'autre part les codeurs CELP bas-débit.

4.5.7 Discussion et perspectives

Tout d'abord, il est à noter que ce test a été effectué en utilisant uniquement deux phrases (une pour chaque locuteur) afin d'éviter une durée de test trop importante. Cela peut donc avoir un impact sur les résultats obtenus ici. Néanmoins comme nous allons le voir dans cette section, les différences entre les codeurs sont relativement nettes et recoupent certains résultats vus aupara- vant.

Le premier résultat, qui ressort de ces tests, est la forte similitude entre les classements de qualité audio et de qualité de spatialisation, quel que soit le test. Deux tests de Pearson ont montré une forte corrélation entre les moyennes obtenues par chaque codeur dans chacune des deux sessions, de l'ordre de 95 % (p<0.0011) pour le test narrowband et de l'ordre de 97 % (p<0.001) pour le test wideband. Soulignons que la plupart des sujets ont relevé la difficulté de noter uniquement la spatialisation en présence de dégradations apportées par le codage dual- mono sur un contenu binaural multi-locuteur. Le codage dual-mono a donc dégradé à la fois la qualité de la spatialisation et la qualité audio dans des proportions similaires.

Un résultat intéressant est que la spatialisation en période multi-locuteur pourrait peut-être même accentuer l'impression de dégradation globale suite à l'encodage dual-mono (voir les résultats de qualité audio ressentie pour le codeur AMR à 4.75 kbits/s, suivant que la spatialisation des deux locuteurs est faite ou non aux mêmes emplacements). Afin de pouvoir mieux évaluer l'impact de la spatialisation sur les résultats en termes de qualité audio, un test de transport de contenu monophonique multi-locuteur a été mené dans la section 4.5.8. Nous obtiendrons ainsi en même temps un classement de nos codeurs en multilocuteur sur un contenu monophonique.

4.5 Evaluation de la qualité de signaux de parole binauraux multi-locuteur encodés-décodés en dual-mono par des codeurs monophoniques de parole

Il est par contre possible, que dans le cadre de la conférence audio distribuée, la qualité audio ressentie suite à la spatialisation de signaux dégradés serait jugée meilleure que leur simple somme monophonique. Cela est à tester.

Concernant les classements de qualité audio, les résultats obtenus en narrowband sont identiques à ceux obtenus dans la section 4.3.5 (transport de contenu binaural mono-locuteur sans perte de trame). Les résultats ne nous permettent pas de montrer clairement que l'écart s'est creusé entre notamment le codeur G.711 et les autres entre ce test et le test 4.3, puisque les deux types de test sont différents. Néanmoins, les notes DMOS obtenues pour les codeurs G.729.1 à 12 kbits/s et AMR à 12.2 kbits/s dans la section 4.3.5 sont supérieures à 4 ce qui sous-entend des dégradations audibles mais non gênantes. Les résultats que nous obtenons pour ce test multi-locuteur laissent à penser que les différences perçues sont plus importantes.

En wideband, toujours pour la qualité audio perçue, nous n'avons plus l'équivalence entre les codeurs G.722, AMR-WB à 23.85 kbits/s et le G.729.1 à 32 kbits/s que nous avions dans la section 4.3.6 en présence d'un seul locuteur. Les résultats du G.722 sont en effet nettement meilleurs que ceux des deux autres pour le transport d'un contenu binaural multi-locuteur. On peut ici en déduire que le G.722 s'est bien mieux adapté pour le transport d'un contenu binaural multi-locuteur que les codeurs CELP.

Il résulte que les codeurs G.711 ou G.722, par leur nature, sont les plus adaptés à transporter des contenus binauraux multi-locuteur en termes de qualité audio (proche d'excellent) et de qualité de spatialisation (excellent). La qualité audio et la qualité de spatialisation des codeurs CELP sont jugées nettement en dessous de celles de ces codeurs (au mieux passable pour la qualité audio et bonne pour la qualité de spatialisation). A la vue des résultats obtenus ici et de ceux obtenus dans la section 4.3, la qualité audio ressentie suite à l'encodage dual-mono d'un contenu binaural semble très impactée par la présence d'un second locuteur.

Il faut de plus tenir compte que l'encodage-décodage du premier étage de la configuration centralisée n'a pas été appliqué. Or, à la vue des tests précédents (sections 4.4.5 et 4.4.6), les codeurs G.711 et G.722 sont jugés équivalents en configuration centralisée et en configuration distribuée avec la spatialisation ce qui veut dire qu'ils sont performants lors du transcodage ce qui n'est pas le cas des autres codeurs. Il est donc fort probable que la qualité audio et la qualité de spatialisation de ces deux codeurs subissent moins de dégradations que les autres codeurs avec l'ajout du premier étage.

Documents relatifs