• Aucun résultat trouvé

lutives

On distingue deux grandes classes de méthodes pour la séparation de mé- langes convolutifs : les méthodes fréquentielles qui utilisent la transformée de Fourier pour se ramener à un problème de séparation aveugle de sources ins- tantanée et les méthodes temporelles qui effectuent la séparation au moyen de filtres dits d’extraction estimés dans le domaine temporel. Dans cette section, nous présentons les principes et les limitations respectives de ces deux types d’approche5.

1.4.1

Les méthodes fréquentielles

Les méthodes fréquentielles [125] simplifient le modèle de mélange convolu- tif en utilisant la transformée de Fourier. La relation de convolution (1.2) dans le domaine temporel devient dans le domaine fréquentiel

˙

x(f ) = ˙A(f )˙s(f ) (1.53) En pratique, on utilise la transformée de Fourier à court terme [7, 71, 99, 135, 146,147,163,164,170–172,182,183,192,229], pour obtenir plusieurs échantillons par fréquence mais aussi pour tirer parti de la variabilité temporelle des signaux sources, par exemple leur non-stationnarité [146,147,163,164,170–172] ou leur 5Le tableau 1.2 en fin de section récapitule les avantages et inconvénients des deux types

1.4. Classification des méthodes de SAS convolutives 31 parcimonie dans le cadre d’approches déterministes [7, 71, 229] (on montre que la transformée de Fourier à court terme est optimale pour les signaux de parole [176]). On obtient alors l’équation de mélange suivante :

˙

x(f, t) = ˙A(f )˙s(f, t) (1.54) Par ces méthodes fréquentielles, on obtient donc pour chaque fréquence un mé- lange linéaire instantané complexe que l’on peut séparer en utilisant les mêmes critères qu’en séparation de sources instantanée. Ces méthodes fréquentielles présentent cependant trois difficultés majeures :

– Les indéterminations d’échelle et de permutation propres à la séparation de sources font qu’un vecteur source obtenu pour une fréquence donnée peut être pondéré et ordonné de façon différente de celui obtenu à une autre fréquence. La reconstruction des signaux dans le domaine temporel nécessite de corriger cet effet.

– En utilisant la transformée de Fourier à court terme, on obtient beaucoup moins de points pour chaque fréquence, ce qui rend difficile l’estimation des statistiques [16]. Pour certains algorithmes en effet, il est nécessaire que la taille de fenêtre utilisée par la transformée de Fourier à court terme soit beaucoup plus grande que l’ordre des filtres de mélange, ce qui en- gendre un faible nombre d’échantillons par fréquence. Une méthode qui pallie ce problème a été proposée par C. Servière [186].

– Un autre problème vient du fait que l’équation (1.53) n’est parfaite- ment valide que si le mélange est modélisé en utilisant l’opérateur de convolution circulaire alors que le mélange réel réalise une convolution linéaire. Ce problème a été étudié par plusieurs auteurs qui ont mon- tré [16, 147] que l’approximation n’est acceptable que si la longueur des fenêtres temporelles est suffisamment grande par rapport à l’ordre des filtres de mélange (plus grande d’un facteur 2 au moins).

Notons que le problème des permutations évoqué plus haut peut être évité si une unique source active dans un intervalle de temps permet d’estimer les paramètres de mélange de cette source pour toutes les fréquences [10, 12].

Un algorithme fréquentiel de type point fixe directement adapté de FastICA a été développé par R. Prasad et al. [165] pour la séparation de mélanges convolutifs de signaux de parole.

Dans la première partie de cette thèse, nous considérons les mélanges de signaux stationnaires et cherchons à éviter le problème des indéterminations d’échelle et de permutation bande à bande en introduisant pour cela une mé- thode temporelle.

32 Chapitre 1. Mélanges convolutifs : état de l’art

1.4.2

Les méthodes temporelles

Les méthodes temporelles à structure directe cherchent à estimer une source ou une de ses contributions à l’aide d’une combinaison convolutive des signaux d’observations : y(n) = P k=1 hk(n) ∗ xk(n). (1.55)

Par rapport à la séparation de mélanges linéaires instantanés, on a donc remplacé l’estimation d’un vecteur d’extraction composé de scalaires par l’es- timation d’un vecteur de P réponses impulsionnelles de filtres hk(n) associés

aux P observations. L’estimation est donc rendue plus difficile en raison du grand nombre d’inconnues, en particulier si l’ordre élevé du mélange impose de choisir des filtres d’extraction hk(n) d’ordre élevé.

La séparation convolutive de sources dans le domaine temporel est très liée aux problèmes de déconvolution aveugle [72,100,187,188,221], la déconvolution cherchant à estimer à l’aide d’un filtre une source unique i.i.d. ayant subi un filtrage par le milieu de propagation.

De plus, historiquement, un des premiers critères de séparation de sources (pour mélanges instantanés), l’autocumulant d’ordre 4 ou kurtosis fut introduit par Wiggins en 1978 pour la déconvolution aveugle de sources sismiques [221]. Il s’est inspiré du théorème de la limite centrale et du fait qu’une combinaison linéaire de sources aléatoires indépendantes non-gaussiennes de même distribu- tion est davantage gaussienne que les sources d’origine. Le critère qu’il propose pour mesurer cette non-gaussianité, le kurtosis normalisé (1.39), est maximum en valeur absolue lorsque le filtre appliqué à l’observation restitue le signal i.i.d. à l’entrée du canal de propagation (le filtre de déconvolution est alors égal à l’inverse du filtre du canal, à un retard et un facteur multiplicatif complexe près).

De la même façon, N. Delfosse et P. Loubaton ont montré [61] en sépa- ration de mélanges linéaires instantanés que la valeur absolue ou le carré du kurtosis (non-normalisé) du signal de sortie normalisé est maximisée lorsque les coefficients d’extraction utilisés correspondent à un facteur près à une ligne de l’inverse de la matrice de mélange.

Ce lien entre séparation de sources et déconvolution a induit des méthodes temporelles [212–214], dédiées aux mélanges convolutifs et utilisant le critère du kurtosis normalisé. Cependant, les méthodes proposées étaient lentes du fait du nombre important de paramètres à estimer et de l’utilisation d’algorithmes de type gradient pour optimiser le critère. Un autre algorithme d’optimisation, utilisé par F. Abrard et Y. Deville [6, 8] et basé lui sur l’algorithme de New- ton, est plus rapide mais reste très lent lorsque l’ordre choisi pour les filtres d’extraction est élevé. D’autre part, la consistance du critère de séparation n’a été prouvée que pour des filtres d’extraction infinis ou pour des filtres d’ordre

1.5. Conclusion 33