• Aucun résultat trouvé

Comparaison avec d'autres méthodes

4.3 Évaluation numérique

4.3.2 Comparaison avec d'autres méthodes

Nous présentons ici une comparaison entre notre algorithme (cas non bruité) et deux autres algorithmes pour la séparation de mélanges convolutifs9, l'algorithme de Murata, Ikeda et Ziehe [81] et l'algorithme de Parra et Spence [85, 84]. Pour cela, nous utilisons leurs codes Matlab qui sont disponibles sur le Web (voir [77, 86]).

La méthode de Murata, Ikeda et Ziehe est basée sur une approche temps-fréquence où ils appliquent la décorrélation temporelle au long des bandes fréquentielles de Fourier. Ils exploitent en réalité le contenu des signaux audio an d'accomplir leur séparation aveugle. Quant à l'ambiguïté de permutation due à la procédure de séparation fréquence par fréquence, les auteurs fondent leur solution sur la maximisation de la corrélation entre les enveloppes des spectres, fréquence par fréquence (voir le détail de l'algorithme dans le chapitre 2).

Parra et Spence proposent de séparer les sources en diagonalisant une matrice de covariance. La procédure est eectuée dans le domaine de Fourier à chaque fréquence, où ils calculent un périodogramme par une TF glissante. Leur critère de diagonalisation est adaptatif et fondée sur le minimisation d'un critère. Le problème de permutation dans cette méthode est résolu en imposant une contrainte de continuité ("lissage") fréquentiel (voir chapitre 2).

4.3.2.1 Expériences et mesure de performance

Nous nous plaçons dans le cas de 2 sources et 2 capteurs. Nous utilisons les signaux réels de l'Université McMaster [103] pour lesquels nous simulons diérents chemins de propagation. Les sources se propagent de leurs origines jusqu'aux capteurs de mesures en suivant chacune un chemin. Chaque chemin est déni par une combinaison composée d'un angle, une distance et une hauteur (voir la section4.1.2). Nos expériences ont été réalisées avec les combinaisons dont l'angle est xé à : 0°, 45°, 90°, 270° et 315°. Ceci correspond nalement à 20 cas de séparations possibles. Tous les signaux utilisés sont échantillonnés à 11,025kHz, avec une durée de 18048 échantillons. Les réponses impulsionnelles de la matrice de mélange sont tronquées à 1024 retards. La FFT est réalisée sur 512 points.

9une étude comparative plus exhaustive a été aussi réalisée pour le projet BLISS (voir le rapport

2 1

Fig. 4.35 sources audio utilisées.

Nous faisons tourner les trois algorithmes avec les mêmes entrées et en sortie nous récupérons les données à comparer. Nous procédons ainsi à l'analyse de leur performance par le calcul de l'indice (4.10). Cette mesure de performance a été développée spéciale-ment pour le cas de séparation aveugle de mélanges convolutifs ; l'analyse de la qualité de séparation dans cet indice est portée sur le système global [57].

4.3.2.2 Évaluation des résultats

Avant d'exposer les résultats numériques de cette comparaison, nous commençons d'abord par expliquer le principe de notre mesure de performance. Le système (ltre) global, matrice résultant du produit entre la matrice de mélange et la matrice de sépara-tion, est à la base de cette mesure. En eet, celui-ci nous permet d'analyser la qualité de séparation obtenue par chaque méthode par rapport à la bonne séparation de mélanges convolutifs, qui est dénie par une matrice diagonale pour le ltre global et sans qu'il ait d'ambiguïtés dans la séparation. Sachant que les ambiguïtés de séparation possibles sont :

i l'ambiguïté de permutation globale (i.e. système global sous forme de matrice anti-diagonale ou inter-changement des lignes du ltre de séparation) ;

ii l'ambiguïté d'échelle globale (i.e. lignes du système global ou du ltre de sé-paration multipliées par des constantes) ;

iii l'ambiguïté de ltrage de permutation et/ou d'échelle (i.e. application d'un certain ltrage aux signaux séparés) ;

l'objectif reviendrait à mesurer la performance avec un indice inchangé par rapport à ces ambiguïtés.

Pour cette n, un indice ecace est développé pour pouvoir répartir le facteur d'échelle (ambiguïté ii), circonvenir l'ambiguïté iii et mesurer enn la similitude avec

une matrice de permutation globale (ambiguïtéi). Cet indice est appelé "Indice d'Amari pour les mélanges convolutifs". Il s'applique sur le système global C = G∗H comme suit :

a) cette étape traite l'ambiguïté d'échelle. Nous normalisons les lignes de C en empilant les ltres de chaque ligne dans un long vecteur que nous normalisons. Ensuite, nous remettrons les éléments de ce vecteur dans leurs entrées originales. Par ceci, nous répartirons l'ambiguïté d'échelle.

b) quant à cette étape, elle traite l'ambiguïté de ltrage. Nous calculons la norme de chaque ltre dans C et nous la stockons dans une nouvelle matrice C˜. Cela en fait résume les proportions globales des contributions entre les sources origi-nales et les sources séparées. Ainsi, la construction de cette matrice permet de savoir que la contribution d'une source est nulle ou très faible quand l'élément correspondant dans cette matrice est faible ou nul.

c) la dernière étape calcule le degré de séparation par l'indice d'Amari (voir l'An-nexeE) qui mesure la similitude à une matrice de permutation :

X i   X j |C˜ij| max k |C˜ik|1  +X j   X i |C˜ij| max k |C˜kj| 1   (4.10)

Les résultats numériques de comparaison, obtenus par l'application des trois algo-rithmes sur les mélanges convolutifs des deux sources audio de la gure4.35, sont repré-sentés par des graphique en niveau de gris. Chaque graphique est divisé en rectangles correspondant chacun à un chemin de propagation déni par deux angles. Le niveau de gris de chaque rectangle indique la valeur de l'indice d'Amari pour les mélanges convo-lutifs. Pham 0 0.25 0.5 0.75 1 45° 90° 270° 315° 45° 90° 270° 315° Parra 0 0.25 0.5 0.75 1 45° 90° 270° 315° 45° 90° 270° 315° Murata 0 0.25 0.5 0.75 1 45° 90° 270° 315° 45° 90° 270° 315°

Fig. 4.36 Indices d'Amari.

L'analyse de la performance des trois algorithmes à partir des précédents graphiques révèle que notre algorithme produit la solution la plus ecace en terme d'ambiguïté de séparation et fournie la plus bonne performance par rapport au reste des algorithmes. En eet, sur l'ensemble des expériences réalisées, la meilleure valeur de l'indice a été obtenue

par notre algorithme dans 64% des cas10, par l'algorithme de Parra dans 16% des cas et n'a jamais été obtenue par l'algorithme de Murata. Ceci est conrmé par l'intensité du niveau de gris sur les trois graphiques.

Par ailleurs, nous pouvons aussi constater que la séparation est de meilleure qua-lité lorsque les sources arrivent aux capteurs, de directions (angles) très diérentes (de diérents cotés), ce qui permet de ne pas mélanger les sources trop fortement. Plus les chemins des sources se rapprochent, plus les signaux qui arrivent aux capteurs sont mélangés et ainsi leur séparation est plus dicile.

Documents relatifs