• Aucun résultat trouvé

Décomposition parcimonieuse appliquée à l’analyse d’image

Type et échelle de déformations

2.3 Décomposition parcimonieuse appliquée à l’analyse d’image

Comme nous l’avons présenté dans la section 2.1, une analyse d’image se fonde sur la détection d’information d’un certain niveau. Le choix du niveau auquel est traité un signal est conditionné par le type d’images ainsi que par les informations que l’on souhaite mettre en évidence. Il est possible de rechercher différents types d’éléments dans un signal. Mais il est également possible de rechercher un espace de représentation adapté au problème à résoudre. Il s’agit de ré-encoder le contenu de l’image, et plus précisément, de l’exprimer dans un nouveau référentiel plus adapté à l’analyse. On entend par « plus adapté », que cette nouvelle représentation permette de faire ressortir l’information utile dans son environnement. Un changement d’espace permet d’obtenir une nouvelle représentation et ainsi d’analyser le signal sous un autre angle en révélant des propriétés inaccessibles dans le domaine original. Le principe de la parcimonie vise à trouver une représentation qui concentre l’information utile dans un petit nombre de paramètres non nuls, en comparaison du grand nombre de paramètres associés au référentiel utilisé.

Pour un signal S donné, il existe de nombreuses représentations équivalentes, c’est-à-dire sans perte d’information, les plus utilisées sont sans doute les décompositions fréquentielles. L’utilisation d’une décomposition d’un signal dans un nouveau référentiel afin d’obtenir une représentation parcimonieuse a connu un essor considérable ces dernières années. La problématique de la parcimonie a fait l’objet de nombreux travaux concernant les signaux sonores mais aussi les images.

Si les applications les plus connues sont du domaine de la compression (JPEG, MP3 …), cette notion est également très présente dans la représentation de fonctions [Hon07], ou le débruitage [Dab08]. Une telle méthodologie peut également servir pour la séparation de source [Bob99], ou de « type » de données.

Dans cette section, nous rappellerons la définition ainsi que les différents travaux qui gravitent autour de la problématique de la décomposition parcimonieuse d’un signal. Dans le cadre de cette thèse, nous nous intéresserons principalement aux travaux effectués sur des images.

2.3.1 Définition

Soit un signal S, composé d’un agencement d’éléments constituant dans un domaine E donné. Les éléments couramment utilisés pour les images en noir et blanc sont les niveaux de gris. Un tel signal peut être mathématiquement défini par :

(2.11)

où représente un niveau de gris, ou les atomes constitutifs du signal, et est le dirac en (i,j), il indique la distribution de cette primitive constitutive dans l’image.

Un signal S de dimension n est dit K-parcimonieux, si on peut représenter, ou approximer, le signal S avec K composantes (ou atomes) d’une base comportant n éléments (K<<n). Le but est de trouver les K éléments qui, en nombre restreint, représenteront au mieux le signal, dans un référentiel adapté.

Dans la littérature, l’ensemble des atomes utilisés est appelé dictionnaire. Notons D, le dictionnaire, et ∈ { . Un signal S donné est représenté relativement au dictionnaire D par une juxtaposition linéaire des atomes suivant un vecteur de décomposition tel que :

avec ∈ Rn (2.12)

Un exemple d’une telle décomposition du signal est donné dans l’exemple des figures 2.15 et 2.16 ci-dessous.

Figure 2.15 – Exemple de décomposition d’un signal dans une base

Figure 2.16 – Deux décompositions possibles d’un signal

Une telle décomposition est parcimonieuse dans le cas où le vecteur est principalement

constitué de 0. L’idée est de coder le signal étudié à l’aide d’un nombre réduit d’atomes fortement corrélés au signal S. Une approche permettant d’obtenir une représentation parcimonieuse est l’utilisation d’un dictionnaire redondant. On remarquera que la représentation du signal n’est pas unique avec un tel dictionnaire. La figure 2.16 montre deux exemples ( ’ et ’’) de décomposition d’un signal S’ à l’aide d’un dictionnaire D’.

Dans la plupart des cadres applicatifs, bien que l’entropie d’un signal naturel soit faible en comparaison de l’ensemble des signaux pouvant être imaginé, la décomposition exacte de

S peut nécessiter un dictionnaire très important pour représenter toute sa richesse. Ce grand

nombre d’atomes réduit l’efficacité de ce type de méthodologie. Si une reconstruction parfaite du signal est une bonne chose pour la compression par exemple (cf [Mat02] pour une étude de différentes compressions fondées sur la parcimonie), une problématique de classification n’aura pas besoin de ces mêmes paramètres. Il est donc parfois nécessaire de simplifier le signal, ou de regrouper certains constituants « proches » d’après le dictionnaire utilisé. Le signal est alors approximé, a un seuil près. représentera l’erreur maximum de reconstruction du signal tel que :

‖ ‖ (2.13)

avec la norme Lp définie par : ‖ ‖ ∑ | | ⁄

Les atomes constituant le dictionnaire peuvent prendre différentes formes : des sinusoïdes (cas de la transformée de Fourier), des gaborettes, des ondelettes ou encore des portions de l’image étudiée (cf Fig 2.17 & 2.18).

Image I Composants de l’image Distribution des composants (niveaux de gris)

Figure 2.17 – Image en 256 niveaux de gris, où chaque élément de la base de représentation est utilisé

Image I recomposée à Composants du dictionnaire Distribution parcimonieuse partir des motifs ci-contre (motifs de 10 x 10 pixels) des composants

Figure 2.18 – Image construite à partir d’un vocabulaire de

Cette section a pour but de retranscrire l’éventail des possibilités, les forces et les faiblesses, de ce type d’approche. Les paragraphes suivants traitent des différents points qui sont au cœur du changement de représentation du signal visant à obtenir une distribution parcimonieuse de ces atomes constitutifs. Pour arriver à un tel résultat, deux aspects principaux doivent être pris en compte :

- le domaine de représentation des atomes (portion du signal, ondelettes …), - la méthode permettant d’élaborer un dictionnaire.

Après un rappel des principaux espaces de représentation utilisés, ainsi que des algorithmes de décomposition du signal pour un dictionnaire donné, nous ferons un tour d’horizon des différents types de méthodes de décomposition du signal.

2.3.2 Domaine de représentation

Le dictionnaire est l’ensemble des entités, ou atomes, permettant de reconstituer ou d’approximer le signal. La définition du dictionnaire est un enjeu important dans une étude reposant sur la parcimonie du signal. Le choix du dictionnaire est au cœur du degré de parcimonie. Les différentes problématiques (compression, séparation de sources …) ainsi que la variété des signaux (musique, écho radar, photo, image médicale …) ne permet évidemment pas l’utilisation d’un dictionnaire universel. Il existe deux types de dictionnaires d’atomes :

- atomes de synthèse : fondés sur des propriétés ou fonctions adaptées au signal étudié, - atomes réels : constitués d’une portion de données, comme les dictionnaires adaptatifs

obtenus par apprentissage présentés dans [Pey07].

Les constituants artificiels ont pour objectif de décomposer l’image traitée à l’aide d’une famille d’atomes simples. Ces atomes doivent être suffisamment élémentaires pour retranscrire une classe de fluctuation dans l’image. Les dictionnaires artificiels sont simples d’utilisation mais doivent être bien adaptés au signal traité pour obtenir une forte parcimonie. L’utilisation de représentations temps/fréquence est très répandue. La force de ce type de dictionnaire consiste en la possibilité de coder une portion du signal avec un élément du dictionnaire ayant subi une transformation. Le dictionnaire devient alors un ensemble pouvant générer de nouveaux atomes. Les atomes permettant de décomposer le signal dans des repères temps/fréquence les plus connus sont la transformée de Fourier, les ondelettes, ou encore, plus spécifiques, la transformée en Ridgelets, les Curvelets [Can02]. Afin de mieux appréhender ce type de représentation, l’élaboration d’un dictionnaire basé sur la transformée de Fourier et sur les ondelettes est détaillé ci-dessous.

Les atomes réels sont des « patterns » extraits du signal lui-même. Dans le cadre du son, un signal court peut ainsi représenter une note, ou un ensemble de signaux peuvent représenter un instrument donné. Pour les images, une portion de signal revient à extraire une imagette sans limite de forme. Quelques exemples applicatifs sont retranscrits dans cette section pour illustrer les différentes possibilités de représentation du signal.