• Aucun résultat trouvé

Transformée de Fourier

Le principe de la transformée de Fourier [24] est généralement connu des pro-téomiciens, celle-ci étant régulièrement utilisée dans des spectromètres de masse : il s’agit d’analyser un signal f (t), initialement décrit au moyen d’une fonction f de la variable temporelle t, afin de le redécrire différemment, au moyen d’un ensemble d’harmoniques6; ensuite, il est possible de déduire des harmoniques, la masse des ions analysés par le spectromètre. Formellement, la transformée de Fourier TF[f ] de

f est une fonction définie par :

TF[f ](ν) =

Z +∞

t=−∞

e−iνtf (t)dt (1.8)

Il s’agit donc de l’intégrale du produit de deux fonctions : tout d’abord, le signal d’intérêt f (t), dépendant du temps ; ensuite, une autre fonction, impliquant le temps

t et la fréquence ν, et dont la forme est e−iνt. Cette dernière est appelée le noyau de la transformée. Notons que le produit noyau-signal n’est intégré que sur le temps, de sorte qu’il est normal d’obtenir comme résultat, une fonction de la fréquence ν.

Analyse temps-fréquence

La transformée de Fourier s’intéresse au signal globalement. Or si celui-ci varie dans le temps (ou dans l’espace, dans le cas d’un signal bidimensionnel comme une image par exemple), il peut être intéressant de ne se focaliser que sur une fenêtre particulière du signal, centrée sur un instant τ , puis de faire varier la valeur de τ afin d’avoir une caractérisation local du signal. Concrètement, pour ce faire, il suffit d’annuler le signal partout, sauf dans la fenêtre de temps que l’on considère. Cette

6. Les harmoniques sont les différentes fréquences composant le signal, que l’on peut séparer les unes des autres, sur le principe des éclairages de boites de nuit, dont les pulsations à différentes fréquences suivent la musique.

fenêtre se modélise facilement par une fonction w (pour “window”) qui vaut 1 pour l’intervalle d’intérêt et 0 ailleurs, avec laquelle on va multiplier le signal :

TF L[f ](τ, ν) =

Z +∞ −∞

e−iνtw(t − τ )f (t)dt (1.9)

Dans le cas d’un signal bidimensionnel, nous aurons :

TF L[f ](x, y, νx, νy) =

Z +∞

x=−∞

Z +∞

y=−∞

e−i(νxx+νyy)w(x − x, y − y)f (t)dxdy (1.10)

avec (x, y) caractérisant la localité de la fenêtre d’étude, et (νx, νy) correspondant aux fréquences sur chacune des dimensions de l’image. Finalement, il est aussi pos-sible d’avoir des fenêtres plus ou moins larges, afin de caractériser le signal à dif-férentes échelles, les fenêtres étroites capturant tous les détails, et les fenêtres plus larges se rapprochant d’une description globale du signal : c’est ce que l’on appelle l’analyse temps-fréquence (ou par analogie, l’analyse espace-fréquence).

Ondelettes

La transformée de Fourier peut intuitivement être comprise comme une généra-lisation des séries de Fourier : ces dernières furent développées par Joseph Fourier durant ses travaux sur la propagation de la chaleur : il s’agissait pour lui de modé-liser la température à l’extrémité d’une barre de fer, quand on applique une source de chaleur dont la température varie périodiquement au cours du temps à l’autre extrémité. La transformée de Fourier peut être vue comme le cas extrême où la période de variation de la température de la source de chaleur est tellement longue que, finalement, elle n’est plus périodique. Cependant, le lien avec les signaux pé-riodiques est encore visible dans la transformée de Fourier. En effet, le noyau e−iνt peut aussi s’écrire sous la forme cos(−νt) + i sin(−νt) : les fonctions sinusoïdales sont une famille génératrice des signaux périodiques. En effet, il est possible de dé-composer tout signal périodique en une série (une somme avec éventuellement un nombre infini de termes) de fonctions sinus et cosinus.

Dans le cas où le signal d’intérêt n’est pas une variation de chaleur au cours du temps, mais la variation d’intensité de la couleur sur une image, le noyau e−iνt = cos(−νt) + i sin(−νt) n’a aucune raison de fournir une décomposition du signal qui soit “adaptée”. C’est pourquoi, la théorie de Fourier a été généralisée à d’autres noyaux pour donner la théorie des ondelettes [24]. Le terme ondelette désigne en fait simplement un noyau, localisé dans l’espace ou dans le temps (le noyau inclut donc la fonction fenêtre w) et défini par un niveau de granularité. D’un point de vue imagé, on peut voir le noyau comme une fonction nulle partout à l’exception d’une localisation autour de laquelle le signal prend la forme d’une petite vague. Celle-ci peut être plus ou moins “zoomée” afin de permettre une caractérisation multi-échelle ; et déplacée, afin de caractériser localement le signal en tout point. Formellement, la transformée en ondelette de noyau ψ est définie par :

Tψ[f ](p, s) =

Z

Xψ(p, s, x)f (x)dµ(x) (1.11) Dans cette formule, p et s permettent de caractériser le signal en termes de position et d’échelle (s pour “scale” en anglais) tout comme la fréquence ν et la position

τ de la fenêtre dans le temps pour l’analyse de Fourier temps-fréquence. L’étoile

en exposant indique le complexe conjugué7; quant à l’intégrale, si elle prend une forme légèrement différente, c’est simplement parce qu’elle est écrite de manière plus générale. Plutôt que d’intégrer entre −∞ et +∞, éventuellement sur les deux dimen-sions de l’image, l’intégrale est ici définie sur un domaine quelconque X (pouvant représenter le temps, la surface d’une image ou quoi que ce soit) qui a la propriété8 d’être mesurable ; à cet égard dµ(x) ne représente que des parties mesurables de X qui sont sommées par l’intégrale.

Apprentissage de dictionnaires

Une fois le principe de l’ondelette établi, il reste encore à choisir la famille de noyaux permettant d’obtenir cette caractérisation multi-échelle (en faisant varier p et s). Naturellement, il n’est pas possible de prendre n’importe quoi. Comme nous en avons eu l’intuition à propos de la transformée de Fourier, une analyse harmonique par un opérateur intégral n’est intéressante que si elle permet de reconstruire le signal d’origine à partir de la description qu’en donne sa transformée ; ainsi tout signal périodique peut être reconstruit à partir de sa série de Fourier. De même, à partir de la transformée de Fourier d’un signal, il est possible de retrouver le signal d’origine, en appliquant la transformée de Fourier inverse, dont la formule est particulièrement proche de la “vraie” transformée (attention au signe de l’exponentielle) :

f (t) =

Z +∞ −∞

e+iνt· TF[f ](ν)dν (1.12)

Comme expliqué plus haut, pour que cette reconstruction soit possible, il faut que la famille de noyaux soit génératrice des fonctions que l’on cherche à décrire : en d’autres termes, en sommant les individus de cette famille, il est possible de recons-truire n’importe quelle fonction parmi celles que nous avons la prétention de décrire. À titre d’exemple, la famille des Gaussiennes (dont on fait varier la moyenne et la variance pour ajuster les paramètres de position p et d’échelle s) est génératrice des fonctions C (fonctions continues, infiniment dérivables et de dérivées successives continues) sur R. Les Gaussiennes peuvent donc servir d’ondelettes. De même pour la distribution dite du chapeau mexicain, ou l’ondelette de Haar, adaptée à la nature discrète des images numériques, telles qu’illustrées sur la Fig. 1.5.

Ces ondelettes sont particulièrement “génériques” : il est possible de décrire un très grand nombre de fonctions grâce à elles. Cette généricité se fait bien sûr au dé-triment de la spécificité. Ainsi, si nous ne nous intéressons qu’à une classe réduite de signaux ayant une forme spécifique, il peut être avantageux de prendre une famille de noyaux moins générique, mais permettant d’obtenir une description plus fine (erreur de reconstruction plus faible) et plus compacte (faisant intervenir moins d’éléments à sommer dans la reconstruction du signal d’origine). Ceci étant d’autant plus vrai que X , le domaine de définition des signaux, est de grande dimension. Les signaux à

7. Un détail mathématique que l’on retrouve sous la forme de la négativité dans l’exponentielle du noyau de Fourier. La compréhension de son origine n’est pas nécessaire à la suite de lecture.

8. Cette notion de mesurabilité n’est pas indispensable. Cependant, nous l’avons déjà abordée lors de la modélisation du hasard en statistique : une variable aléatoire associe à chaque évènement, un ensemble dont on peut mesurer la taille. L’espace probabilisé est lui aussi mesurable.

Figure 1.5 – Ondelettes “Chapeau mexicain” et de Haar - tirés de [38, 39].

décrire constituent eux-mêmes une famille génératrice et très compacte des signaux à décrire, mais la redescription résultante n’aura pas d’intérêt. Il est plus intéressant de trouver un petit sous ensemble de signaux, nommé dictionnaire, qui permet de regénérer l’ensemble, à la manière de ce que l’on cherche à faire en compressant l’information9 : un exemple à la fois parlant et rigoureux consiste en la description d’un flocon de neige à l’aide du motif élémentaire qui le compose, ainsi que des différents facteurs d’échelle à appliquer pour reconstruire la figure complète. Cette recherche d’un petit sous-ensemble permettant la génération des signaux est quali-fiée de description parcimonieuse, et a trouvé beaucoup d’application en vision par ordinateur [43,44]. Nous reviendrons plus tard sur ce concept de parcimonie ; pour l’instant, attardons-nous sur un autre élément d’importance, à savoir que l’espace de redescription des données est induit par les données elles-mêmes.