• Aucun résultat trouvé

3.4 Dictionnaires

3.4.2 Dictionnaires redondants

Afin de mieux cerner le caractère décisif du choix des atomes, nous présentons ci-dessous quelques atomes caractéristiques, ainsi que leurs spécificités intrinsèques.

3.4.2.1 Atomes fréquentiels

Atomes DFT

Une représentation issue d’atomes de la transformée de Fourier génère une décomposition propice à l’analyse harmonique d’un signal. L’expression de la transformée de Fourier discrète mono-dimensionnelle, notéeF, d’un signal f de dimensionNest la suivante :

Fk = NX−1

n=0

Dictionnaires 63

Les atomes associés à la transformée de Fourier discrète sont les fonctions :

an,k =e2iπknN

Le dictionnaire ainsi créé se compose deNformes d’ondes dont les atomes sont orthogonaux deux à deux. Pour obtenir un dictionnaire de Fourier sur-complet, il suffit de faire un échantillonnage plus fin des fréquences.

Cependant la plupart des algorithmes qui résolvent le problème d’optimisation (3.1) ne sont malheureusement pas adaptés au cas complexe. En général, lors de l’utilisation de la transformée de Fourier discrète, on sépare la partie réelle de la partie imaginaire ou bien le module de la phase. Généralement, les dictionnaires utilisés sont des dictionnaires de cosinus ou de sinus. Cependant de récents travaux [MBZJ08] ont présenté un algorithme de résolution de ce problème sous-déterminé dans le cas complexe, basé sur la «norme»l0.

La périodicité de l’exponentielle rend de fait les atomes de la DFT particulièrement sensibles aux signaux périodiques. L’avantage est double : cela permet à la fois de modéliser avec parcimonie des signaux de type périodique mais également de propager le signal en répétant le motif élémentaire sur un plus grand support. Nous développerons ce second point dans les chapitres suivants.

Atomes DCT

La transformée en cosinus discrète usuelle est une transformée dont les atomes générateurs sont proches de la transformée de Fourier, puisqu’il s’agit d’un cosinus :

Fk= N−1 X n=0 fncos " kπ N n+1 2 #

Les atomes sont les fonctions :

an,k = r 2 Ncos " kπ N n+ 1 2 #

L’avantage de la DCT est d’offrir une décomposition dans l’espace des réels, contrairement à la DFT et de s’adapter ainsi parfaitement aux algorithmes développés dans le cadre des représentations parcimonieuses. Au même titre que la transformée de Fourier, la transformée en cosinus est propice à la reconstruction de signaux périodiques.

L’analyse purement fréquentielle a néanmoins quelques limitations. Elle permet certes de détecter les fréquences dominantes d’un signal, mais elle ne prend pas en compte ses caractéristiques temporelles. Les transformées de Fourier et en cosinus discrètes ne seront pas adaptées pour représenter des signaux non-stationnaires ou encore des discontinuités temporellement localisées.

3.4.2.2 Dictionnaires temps-fréquence

Afin d’enrichir l’analyse qui peut être faite d’un signal, l’analyse temps-fréquence permet d’identifier à quels instants les fréquences du signal varient. Une des premières transformées utilisées pour modéliser des phénomènes non-stationnaires de durée très courte, est la transformée de Wigner-Ville [BF82]. Puis, l’usage d’atomes de Gabor fut démocratisé pour représenter des signaux caractérisés comme non-stationnaires.

64 Représentations parcimonieuses : état de l’art

Les atomes de Gabor sont des fonctions qui ont pour spécificité d’être localisées en temps et en fréquence. Ils sont définis comme étant une fréquence oscillant sur une courte période, localisation obtenue par fenêtrage :

as,t,f(τ)= 1 sw τt s e2iπf(τt)

oùτreprésente la localisation temporelle,sest le paramètre qui définit la largeur de la fenêtrew, dans le domaine fréquentiel. Le choix de la fenêtre n’est pas contraint. On choisit en général des fenêtres aux propriétés fréquentielles satisfaisantes, comme une fenêtre de Hamming.

Le fenêtrage induit une découpe de l’onde en petits morceaux : ce sont les ondelettes de Gabor. Alors que l’analyse de Fourier est un outil efficace pour représenter des signaux stationnaires, les ondelettes de Gabor sont quant à elles utilisées pour représenter des signaux quasi-stationnaires. Comme le fenêtrage permet de segmenter le signal, on peut ainsi modéliser des zones où apparaissent des phénomènes non-stationnaires.

3.4.2.3 Dictionnaires temps-échelle

Pour l’analyse de signaux images, il semble pertinent de s’intéresser aux informations contenues dans l’image à toutes les échelles observables. L’idée est d’allier l’analyse fréquentielle à une analyse par échelles. Les premières fonctions répondant à cette problématique sont les ondelettes de Morlet [JMG82]. Pour traiter des signaux non-stationnaires, il eut l’idée de raccourcir la fenêtre utilisée dans les ondelettes de Gabor. Il partit d’une fonction mèreΨ, il la décala dans le temps, et il changea d’échelle. Il obtint des fonctionsΨ

tb a

aest le facteur d’échelle que l’on choisit petit pour représenter de manière efficace des phénomènes quasi-instantanés.

Plus tard, il fut introduit [Mur89] un paramètre supplémentaire pour prendre en compte la direction dans laquelle l’ondelette oscille. Afin de pouvoir contrôler l’orientation de cette oscillation, on introduit un paramètre θ qui permet de faire varier la direction des oscillations et donc la direction pour laquelle l’ondelette détecte les variations rapides :

Ψ .tb a

!

= cosθ sinθ

sinθ cosθ

!

Cet ensemble de fonctions forme des ondelettes directionnelles.

3.5 Conclusion

Analyser un signal signifie le décomposer en ses éléments constituants. Les représentations parcimonieuses est l’un des outils d’analyse permettant notamment d’extraire les composantes principales d’un signal. La particularité des représentations parcimonieuses est alors de choisir, parmi l’ensemble des représentations possibles, la plus parcimonieuse pour une erreur de reconstruction fixée. Nous avons choisi, dans ces travaux de thèse, d’utiliser les représentations parcimonieuses pour extrapoler des textures au sein des images. Le choix s’est porté sur les représentations parcimonieuses car nous souhaitions exploiter la souplesse dans le choix des outils de représentation, à savoir les dictionnaires. Les atomes qu’ils contiennent seront les briques primordiales nous permettant de «recréer la matière». Même si les atomes du dictionnaire sont, en pratique, en nombre limité, ils sont destinés à être choisis en fonction de leur corrélation avec l’image à représenter, ce qui permet alors d’effectuer, au coeur même du processus, une analyse des données connues. Cette analyse est somme toute limitée par le nombre et la variété des fonctions de base du dictionnaire.

Chapitre 4

Représentations parcimonieuses

adaptées à la prédiction d’image

Nous venons de présenter le domaine des représentations parcimonieuses comme étant un outil majeur pour notamment acquérir une version réduite, compactée, d’un signal donné. Il s’agit là de la première utilisation évidente des représentations parcimonieuses. Nous nous sommes cependant orientés vers une autre utilisation de cet outil : la prédiction d’images. Nous avons vu au chapitre 1 que la prédiction spatiale d’un encodeur de type H.264 est notamment basée sur l’utilisation de recopies et de combinaisons linéaires de pixels limitrophes, le long de directions privilégiées. L’approche est peu complexe et permet d’obtenir des résultats satisfaisants. Cependant, cette technique trouve ses limites lorsqu’il s’agit d’étendre un signal bi-dimensionnel, plus complexe. Nous avons exposé au chapitre 2 les différentes techniques abordées dans la littérature pour synthétiser une texture. Les outils utilisés consistent principalement à extraire de la texture source, ses composantes principales, puis, les connaissant, à synthétiser une texture de dimensions voulues. Nous avons utilisé la même philosophie par le biais des représentations parcimonieuses dans le cadre de la prédiction d’image.

Ce chapitre présente la méthode de prédiction parcimonieuse que nous avons mise en place. Nous détaillons les problématiques soulevées et les solutions que nous proposons. La section 4.3 présente la mise en place de la technique dans un encodeur de type H.264 / AVC et en section 4.4, dans un formalisme de type SVC pour le cas de la prédiction spatiale inter-couches. Les résultats expérimentaux que nous avons obtenus sont rapportés en section 4.5.

4.1 Introduction

Cette introduction a pour vocation de tisser les liens entre les trois domaines recoupés par les travaux présentés dans cette thèse. Ces domaines sont : l’extrapolation de signal, la synthèse de texture et les représentations parcimonieuses.

Les notions d’extrapolation et de synthèse sont très proches et pourraient fusionner en un seul domaine. Cependant, l’idée ici est de présenter la philosophie générale de l’extrapolation de signal, et plus spécifiquement d’un signal mono-dimensionnel plutôt qu’un signal image bi-dimensionnel, afin d’en dégager les points clés.

66 Représentations parcimonieuses adaptées à la prédiction d’image

L’extrapolation de signal consiste à étendre un signal, notons le f ∈Rm, au-delà des données d’observations connues, i.e. on recherche une expression de f sur Rn avec n >> m. L’idée classique en matière d’extrapolation est de supposer que le signal à étendre peut se modéliser par une fonction analytique formelle que l’on choisit, mais dont les paramètres sont inconnus.

Notons laga,b,θoùa,b, θsont, par exemple, les paramètres à estimer à partir des observations dont on dispose. Une des manières d’ajuster la valeur de ces paramètres est de minimiser l’énergie de l’erreur r, entre les données source et l’état courant k du modèle, restreint à l’espace de dimensionm:r= fg(ak,b)|Rm.

Grâce à la fonction analytique ainsi obtenue, on peut calculer les valeurs de nouveaux échantillons sur un ensemble de définition plus vaste, ici Rn, que celui du signal original. Toute la difficulté réside dans la détermination des paramètres inconnus de la fonction analytique de référence.

Reprenons maintenant le formalisme des représentations parcimonieuses. On recherche la représentation parcimonieuse x Rnd’un signal y Rm, en choisissant parmi un ensemble de fonctions de base, ou atomes, notéesaj ∈Rm, les colonnes du dictionnaireA∈Rm×n.

Si on fait le parallèle avec la méthodologie dédiée à l’extrapolation de signal, nous pouvons faire l’analogie suivante : un atome correspond à une fonction formelle, dont les paramètres sont fixés. Comme nous n’estimons plus les paramètres des fonctions de base, ce sont les algorithmes que nous avons présentés précédemment (comme le MP ou le GMF) qui évaluent le degré de correspondance du signal avec les fonctions de base.

Une fois trouvée, la représentation xde dimensionnnous permettra d’obtenir une extension de yde la dimensionmà la dimensionn, sachant que la définition desaj Rm est aussi connue surRn.

4.2 Prédiction parcimonieuse