4.4 Le Matching Pursuit
Le Matching Pursuit s’inscrit dans les algorithmes de poursuite dont il existe plusieurs sortes.
Quelques mots sur les algorithmes de poursuite pour le situer dans son contexte :
Les bases de Fourier et d’ondelette donnent une approximation lin´eaire tr`es pr´ecise pour des signaux particuli`erement r´eguliers. La poursuite de base ou de vecteurs ajoute des degr´es de libert´e suppl´ementaires dans le choix de la base ou dans celui des vecteurs pour repr´esenter le signal. Les vecteurs ainsi choisis mettent en avant les structures principales du signal et donnent par ce biais ses caract´eristiques temps-fr´equence.
Pour mieux comprendre les qualit´es des approximations par poursuite, donnons l’analogie trouv´ee dans [28] :
”Un enregistrement musical comprend souvent au mˆeme instant des notes de dur´ees diff´erentes [...].La mˆeme note de musique peut aussi avoir des dur´ees diff´erentes quand elle est jou´ee `a des ins-tants diff´erents [...]. Pour approximer efficacement un signal musical, il faut que la d´ecomposition dispose de la mˆeme libert´e que le compositeur, qui peut choisir librement les atomes temps-fr´equence (les notes) les mieux adapt´ees `a la repr´esentation d’un son”
4.4.1 Matching Pursuit et repr´esentation avec r´esolution adaptative
Nous allons d´ecrire pr´ecis`ement l’algorithme de Matching Pursuit dans la suite mais tentons d’expliquer d`es `a pr´esent en quoi cette m´ethode permet une repr´esentation temps-fr´equence avec r´esolution adaptative.
Le Matching Pursuit cherche `a approcher un signal x grˆace `a une d´ecomposition atomique o`u les atomes sont choisis dans un dictionnaire (ensemble d’atomes temps-fr´equence) fix´e au d´epart.
La seule condition impos´ee au d´epart sur le dictionnaire est qu’il soit complet, c’est-`a-dire que les combinaisons lin´eaires de ses atomes soient denses dans l’ensemble de d´efinition du signal, L2(R).
Par la suite, les atomes qui seront utilis´es dans la d´ecomposition lin´eaire sont choisis de mani`ere adaptative par rapport au signal x donn´e au d´epart.
Le choix des atomes compris dans le dictionnaire est donc relativement libre et on peut le choisir de telle sorte qu’il contienne plusieurs tailles d’atomes temps-fr´equence. L’algorithme Matching Pursuit choisira parmis les diff´erents atomes ceux dont la taille est la mieux adapt´ee aux caract´eristiques locales du signal.
Ainsi, il est clair que le Matching Pursuit d´efinit des repr´esentations adaptatives de signaux sonores en repr´esentant le signal sous forme de combinaisons lin´eaires d’atomes extraits du dic-tionnaire. Le crit`ere de s´election est ici la corr´elation de l’atome avec le signal. Plusieurs m´ethodes sont propos´ees dans [13] permettant chacune de repr´esenter certaines structures caract´eristiques.
En particulier, le Matching Pursuit Harmonique[13] d´ecompose le signal en composantes harmo-niques ´el´ementaires alors que le Matching Pursuit Chirp´e[13] extrait les variations de fr´equence instantan´ee.
4.4 Le Matching Pursuit 40
4.4.2 Principe du Matching Pursuit
Au d´ebut de l’algorithme, on s´electionne l’atome le plus correl´e avec le signal observ´e. On obtient ainsi une estim´ee `a la premi`ere it´eration de l’algorithme. Celle-ci est le projet´e orthogonal du signal sur l’atome selectionn´e. Si on fait la diff´erence de cette estim´ee avec le signal du d´epart, on obtient le r´esidu.
L’algorithme consiste `a recommencer l’´etape pr´ec´edente sur le r´esidu obtenu : on cherche l’atome du dictionnaire le plus correl´e avec le r´esidu, puis on estime le r´esidu en le projetant sur l’atome selectionn´e. Ensuite on renouvelle le processus jusqu’`a ce que le crit`ere d’arrˆet soit atteint.
Dans la description d´etaill´ee de l’algorithme, on notera r(k)le r´esidu de l’estim´ee ˆx(k)du signal x
`a l’´etape k de l’algorithme, gk l’atome choisi `a l’´etape k de l’algortihme.
4.4.3 La description de l’algorithme
Plus pr´ecis´ement, on distingue les ´etapes suivantes : 0.On initialise ˆx(0)`a 0,r(0) `a x puis k `a 1.
A l’it´eration k,
1.On calcule les corr´elations{hgi,r(k−1)i=gTi .r(k−1)}i=1..n 2.On choisit la plus forte de ces corr´elations :
ik=arg max
i |hgik,r(k−1)i|
3. On met `a jour l’estim´ee ainsi que son r´esidu : ˆ
x(k)=xˆ(k−1)+hgik,r(k−1)igik r(k)=x−xˆ(k)=r(k−1)− hgik,r(k−1)igik
4.On incr´emente k de 1 et on reprend les ´etapes 1,2 et 3 jusqu’`a ce que le crit`ere d’arrˆet soit atteint. Le crit`ere d’arrˆet peut ˆetre le nombre d’it´erations tout comme un rapport signal `a bruit minimum.
4.4.4 Le choix du dictionnaire
On donne ici quelques d´efinitions de dictionnaires multi-´echelles d’atomes temps-fr´equences.
Pr´ecisons que le terme multi-´echelle signifie qu’il y a plusieurs tailles de fenˆetres.
•Dictionnaire de Gabor
On d´efinit le dictionnaire multi-´echelle de Gabor DGabor par l’ensemble des atomes temps-fr´equence de la forme :
ga,t,f(t0) = 1
√ag(t0−t a )ei2πf t0
4.4 Le Matching Pursuit 41
Ces atomes ont ´et´e obtenus par dilatation, translation temporelle et modulation fr´equentielle d’une fenˆetre g. On choisit pour g un fonction paire, positive, dont l’´energie est localis´ee autour du temps 0
•Dictionnaire de chirplets
Le dictionnaire de ”chirplets” Dchir pg´en´eralise le dictionnaire de Gabor. En effet, comme nous le voyons dans la d´efinition ci-dessous, le Dchir pcomprend les atomes dont la fr´equence peut varier avec le temps. Ils s’´ecrivent :
ga,t,f(t0) = 1
√ag(t0−t
a )ei2π[f t0+c2(t0−t)2]
On peut ainsi remarquer que chaque atome a une fr´equence instantan´ee de fga,t,f,c(t0) = f+c(t0−t)
•Utilisation de la librairie MPTK
MPTK (Matching Pursuit Toolkit) est une impl´ementation efficace, d´evelopp´ee `a l’IRISA, de l’ algorithme Matching Pursuit, pour la d´ecomposition parcimonieuse de signaux multicanaux.
MPTK permet de traiter des probl`emes `a grande ´echelle (ex : signaux de plus de 50 millions d’´echantillons) en un temps raisonnable.
Elle permet de d´efinir de mani`ere tr`es pr´ecise le dictionnaire que l’on veut utiliser, les atomes qui y sont et leurs caract´eristiques temps-fr´equence.
Pour le manuel d’utilisation, on pourra se r´ef´erer `a [25]
•Choix du dictionnaire
A pr´esent que nous avons les outils th´eoriques et pratiques pour l’utilisation du Matching Pursuit, il ne reste qu’`a choisir pr´ecis´ement le dictionnaire `a utiliser.
Comme nous l’avons d´ej`a not´e, l’algorithme Matching Pursuit est int´eressant pour traiter notre sujet car on peut utiliser plusieurs tailles et plusieurs types d’atomes. Dans un premier temps, il est int´eressant d’utiliser un dictionnaire de Gabor compos´e de deux tailles de fenˆetre diff´erentes, une petite de 64 ´echantillons par exemple et une grande de 256 ´echantillons par exemple. Cela permettra de d´etecter les diff´erentes composantes du signal analys´e ainsi que ses caract´eristiques.
4.4 Le Matching Pursuit 42
•Repr´esentation graphique
On repr´esente la d´ecomposition en atomes avec Matching Pursuit fait avec les param`etres suivants :
– Le son est un son de glockenspiel de 6 secondes
– Le crit`ere d’arrˆet ´etait le nombre d’it´eration fix´e `a 100 000.
– Les atomes sont des atomes de Gabor de taille : 32,128,256,32768 ´echantillons repr´esentant respectivement 0.7 ; 2.9 ; 5.8 ; et743 ms.
Remarque 4.11 Il est int´eressant de noter ici que la MPTK nous permettrait de s´electionner les atomes de petites tailles qui ont ´et´e choisis par l’algorithme de Matching Pursuit et de les repr´esenter. En effet, une fois une premi`ere approximation faite, on peut s´electionner les atomes qui ont ´et´e chosis pour la reconstruction.
4.4.5 Conclusion et bilan
•Avantages.
Un des avantages est entre autre l’existence de la MPTK qui facilite consid´erablement l’utili-sation de l’algorithme. On peut tr`es facilement changer les atomes pr´esents dans le dictionnaire et donc mettre en ´evidence certaines carct´eristiques du signal selon ce que l’on sait a priori sur le signal utilis´e.
•Inconv´enient.
La repr´esentation temps-fr´equence du Matching Pursuit est pratique car elle fait apparaˆıtre les principales caract´eristiques temps-fr´equence du signal ´etudi´e. Cependant, comme nous pouvons le voir, tout le plan temps-fr´equence n’est pas rempli par les atomes et nous restons sans informations sur les parties du plan qui n’ont pas ´et´e analys´ees par les atomes s´electionn´es. Par ailleurs, il est donc impossible de juger de la parcimonie de la repr´esentation dans ces conditions.
5Proposition alternative aux m´ethodes existantes. 43
5 Proposition alternative aux m´ethodes existantes.
5.1 Introduction
Nous avons expliqu´e dans la section 3.2.6 en quoi le crit`ere entropique pouvait ˆetre consid´er´e comme un crit`ere de parcimonie. Nous allons dans la suite d´etailler un algorithme utilisant ce crit`ere.
On pr´esente dans cette partie un algorithme d´ecrit dans l’article d’Ingrid Daubechies, Michel Defrise et Christine De Mol ”An iterative thresholding algorithm for linear inverse problems with a sparsity constraint”[9]. En effet, on peut trouver de nombreux avantages d’un repr´esentation int´egrant ce crit`ere de s´election et nous verrons cela en d´etail dans ce qu’il va suivre.