Le Matching Pursuit - Traitement etreprésentation temps fréquence des sons avec résolution ada

4.4 Le Matching Pursuit

Le Matching Pursuit s’inscrit dans les algorithmes de poursuite dont il existe plusieurs sortes.

Quelques mots sur les algorithmes de poursuite pour le situer dans son contexte :

Les bases de Fourier et d’ondelette donnent une approximation linéaire très précise pour des signaux particulièrement réguliers. La poursuite de base ou de vecteurs ajoute des degrés de liberté supplémentaires dans le choix de la base ou dans celui des vecteurs pour représenter le signal. Les vecteurs ainsi choisis mettent en avant les structures principales du signal et donnent par ce biais ses caractéristiques temps-fréquence.

Pour mieux comprendre les qualit´es des approximations par poursuite, donnons l’analogie trouv´ee dans [28] :

”Un enregistrement musical comprend souvent au même instant des notes de durées différentes [...].La même note de musique peut aussi avoir des durées différentes quand elle est jouée à des ins-tants différents [...]. Pour approximer efficacement un signal musical, il faut que la décomposition dispose de la même liberté que le compositeur, qui peut choisir librement les atomes temps-fréquence (les notes) les mieux adaptées à la représentation d’un son”

4.4.1 Matching Pursuit et repr´esentation avec r´esolution adaptative

Nous allons décrire précisèment l’algorithme de Matching Pursuit dans la suite mais tentons d’expliquer dès à présent en quoi cette méthode permet une représentation temps-fréquence avec résolution adaptative.

Le Matching Pursuit cherche à approcher un signal x grâce à une décomposition atomique où les atomes sont choisis dans un dictionnaire (ensemble d’atomes temps-fréquence) fixé au départ.

La seule condition imposée au départ sur le dictionnaire est qu’il soit complet, c’est-à-dire que les combinaisons linéaires de ses atomes soient denses dans l’ensemble de définition du signal, L²(R).

Par la suite, les atomes qui seront utilisés dans la décomposition linéaire sont choisis de manière adaptative par rapport au signal x donné au départ.

Le choix des atomes compris dans le dictionnaire est donc relativement libre et on peut le choisir de telle sorte qu’il contienne plusieurs tailles d’atomes temps-fréquence. L’algorithme Matching Pursuit choisira parmis les différents atomes ceux dont la taille est la mieux adaptée aux caractéristiques locales du signal.

Ainsi, il est clair que le Matching Pursuit définit des représentations adaptatives de signaux sonores en représentant le signal sous forme de combinaisons linéaires d’atomes extraits du dic-tionnaire. Le critère de sélection est ici la corrélation de l’atome avec le signal. Plusieurs méthodes sont proposées dans [13] permettant chacune de représenter certaines structures caractéristiques.

En particulier, le Matching Pursuit Harmonique[13] décompose le signal en composantes harmo-niques élémentaires alors que le Matching Pursuit Chirpé[13] extrait les variations de fréquence instantanée.

4.4 Le Matching Pursuit 40

4.4.2 Principe du Matching Pursuit

Au début de l’algorithme, on sélectionne l’atome le plus correlé avec le signal observé. On obtient ainsi une estimée à la première itération de l’algorithme. Celle-ci est le projeté orthogonal du signal sur l’atome selectionné. Si on fait la différence de cette estimée avec le signal du départ, on obtient le résidu.

L’algorithme consiste à recommencer l’étape précédente sur le résidu obtenu : on cherche l’atome du dictionnaire le plus correlé avec le résidu, puis on estime le résidu en le projetant sur l’atome selectionné. Ensuite on renouvelle le processus jusqu’à ce que le critère d’arrêt soit atteint.

Dans la description détaillée de l’algorithme, on notera r^(k)le résidu de l’estimée ˆx^(k)du signal x

à l’étape k de l’algorithme, g_k l’atome choisi à l’étape k de l’algortihme.

4.4.3 La description de l’algorithme

Plus précisément, on distingue les étapes suivantes : 0.On initialise ˆx⁽⁰⁾à 0,r⁽⁰⁾ à x puis k à 1.

A l’it´eration k,

1.On calcule les corr´elations{hg_i,r^(k−1)i=g^T_i .r^(k−1)}_i=1..n 2.On choisit la plus forte de ces corr´elations :

ik=arg max

i |hg_i_k,r^(k−1)i|

3. On met à jour l’estimée ainsi que son résidu : ˆ

x^(k)=xˆ^(k−1)+hg_i_k,r^(k−1)ig_i_k r^(k)=x−xˆ^(k)=r^(k−1)− hg_i_k,r^(k−1)ig_i_k

4.On incrémente k de 1 et on reprend les étapes 1,2 et 3 jusqu’à ce que le critère d’arrêt soit atteint. Le critère d’arrêt peut être le nombre d’itérations tout comme un rapport signal à bruit minimum.

4.4.4 Le choix du dictionnaire

On donne ici quelques définitions de dictionnaires multi-échelles d’atomes temps-fréquences.

Précisons que le terme multi-échelle signifie qu’il y a plusieurs tailles de fenêtres.

•Dictionnaire de Gabor

On définit le dictionnaire multi-échelle de Gabor DGabor par l’ensemble des atomes temps-fréquence de la forme :

ga,t,f(t⁰) = 1

√ag(t⁰−t a )e^{i2πf t}⁰

4.4 Le Matching Pursuit 41

Ces atomes ont été obtenus par dilatation, translation temporelle et modulation fréquentielle d’une fenêtre g. On choisit pour g un fonction paire, positive, dont l’énergie est localisée autour du temps 0

•Dictionnaire de chirplets

Le dictionnaire de ”chirplets” D_{chir p}généralise le dictionnaire de Gabor. En effet, comme nous le voyons dans la définition ci-dessous, le D_{chir p}comprend les atomes dont la fréquence peut varier avec le temps. Ils s’écrivent :

g_a,t,_f(t⁰) = 1

√ag(t⁰−t

a )eⁱ²^π^[^{f t}⁰⁺^c²^(t⁰^−t)²]

On peut ainsi remarquer que chaque atome a une fr´equence instantan´ee de fga,t,f,c(t⁰) = f+c(t⁰−t)

•Utilisation de la librairie MPTK

MPTK (Matching Pursuit Toolkit) est une implémentation efficace, développée à l’IRISA, de l’ algorithme Matching Pursuit, pour la décomposition parcimonieuse de signaux multicanaux.

MPTK permet de traiter des problèmes à grande échelle (ex : signaux de plus de 50 millions d’échantillons) en un temps raisonnable.

Elle permet de définir de manière très précise le dictionnaire que l’on veut utiliser, les atomes qui y sont et leurs caractéristiques temps-fréquence.

Pour le manuel d’utilisation, on pourra se référer à [25]

•Choix du dictionnaire

A présent que nous avons les outils théoriques et pratiques pour l’utilisation du Matching Pursuit, il ne reste qu’à choisir précisément le dictionnaire à utiliser.

Comme nous l’avons déjà noté, l’algorithme Matching Pursuit est intéressant pour traiter notre sujet car on peut utiliser plusieurs tailles et plusieurs types d’atomes. Dans un premier temps, il est intéressant d’utiliser un dictionnaire de Gabor composé de deux tailles de fenêtre différentes, une petite de 64 échantillons par exemple et une grande de 256 échantillons par exemple. Cela permettra de détecter les différentes composantes du signal analysé ainsi que ses caractéristiques.

4.4 Le Matching Pursuit 42

•Repr´esentation graphique

On représente la décomposition en atomes avec Matching Pursuit fait avec les paramètres suivants :

– Le son est un son de glockenspiel de 6 secondes

– Le critère d’arrêt était le nombre d’itération fixé à 100 000.

– Les atomes sont des atomes de Gabor de taille : 32,128,256,32768 ´echantillons repr´esentant respectivement 0.7 ; 2.9 ; 5.8 ; et743 ms.

Remarque 4.11 Il est intéressant de noter ici que la MPTK nous permettrait de sélectionner les atomes de petites tailles qui ont été choisis par l’algorithme de Matching Pursuit et de les représenter. En effet, une fois une première approximation faite, on peut sélectionner les atomes qui ont été chosis pour la reconstruction.

4.4.5 Conclusion et bilan

•Avantages.

Un des avantages est entre autre l’existence de la MPTK qui facilite considérablement l’utili-sation de l’algorithme. On peut très facilement changer les atomes présents dans le dictionnaire et donc mettre en évidence certaines carctéristiques du signal selon ce que l’on sait a priori sur le signal utilisé.

•Inconv´enient.

La représentation temps-fréquence du Matching Pursuit est pratique car elle fait apparaˆıtre les principales caractéristiques temps-fréquence du signal étudié. Cependant, comme nous pouvons le voir, tout le plan temps-fréquence n’est pas rempli par les atomes et nous restons sans informations sur les parties du plan qui n’ont pas été analysées par les atomes sélectionnés. Par ailleurs, il est donc impossible de juger de la parcimonie de la représentation dans ces conditions.

5Proposition alternative aux m´ethodes existantes. 43

5 Proposition alternative aux m´ethodes existantes.

5.1 Introduction

Nous avons expliqué dans la section 3.2.6 en quoi le critère entropique pouvait être considéré comme un critère de parcimonie. Nous allons dans la suite détailler un algorithme utilisant ce critère.

On présente dans cette partie un algorithme décrit dans l’article d’Ingrid Daubechies, Michel Defrise et Christine De Mol ”An iterative thresholding algorithm for linear inverse problems with a sparsity constraint”[9]. En effet, on peut trouver de nombreux avantages d’un représentation intégrant ce critère de sélection et nous verrons cela en détail dans ce qu’il va suivre.

Dans le document Traitement et représentation temps fréquence des sons avec résolution adaptative (Page 39-43)