• Aucun résultat trouvé

Fenêtre pondérée adaptée à la prédiction

5.3.2 Critère d’arrêt

La problématique liée à l’évaluation de la qualité de la prédiction reste identique à celle évoquée dans le cas de la prédiction parcimonieuse.

L’algorithme présenté s’arrête lorsque l’énergie de l’erreur résiduelle devient inférieure à un seuil fixé à l’avance. Il est très difficile de prendre une décision a priori sur la valeur de ce seuil. Idéalement, il faudrait adapter cette valeur en fonction du contenu du voisinage local, pour chaque nouveau voisinage. Nous avons choisi d’introduire une procédure d’arrêt supplémentaire, identique à celle présentée en section 4.2.4.1 pour les algorithmes de représentations parcimonieuses. On introduit une mesure basée sur l’erreur quadratique moyenne pour évaluer la qualité de la reconstruction du pas courant.

5.3.3 Résultats dans un encodeur de type H.264 / AVC

Nous avons implémenté l’algorithme au sein d’un encodeur H.264 / AVC, afin d’en tester les performances.

Configuration de test :

Image source . . . .Barbara512×512

Algorithme . . . Déconvolution / MP

Dictionnaire . . . Néant / DFT réelle

QP . . . .21−26−30−35

Partition . . . .8×8

Sélection des modes intra . . . SAD

Seuil . . . .18/1

Conclusion 109

Nous obtenons (tableau 5.1) des performances similaires en terme de qualité de prédiction et de débit. L’algorithme de déconvolution proposé présente néanmoins l’avantage de converger plus rapidement vers une solution répondant au critère établi. La base de fonctions utilisées est plus riche car c’est une base complexe. Si bien que l’algorithme nécessite de moins d’itérations que le MP pour générer une prédiction comparable.

On peut d’ailleurs remarquer d’après le tableau de résultats 5.1, que le surcoût en déconvolution est inférieur à celui du MP. Comme nous l’avons explicité en section 5.2.5, cette différence est liée à la richesse de la base de Fourier complexe utilisée dans l’algorithme de déconvolution spectrale, ce qui conduit ainsi à réduire le nombre d’itérations nécessaires. La prédiction parcimonieuse basée sur une DFT réelle nécessite quant à elle de plus de fonctions de base pour modéliser le signal.

Sans prise en compte du surcoût Avec prise en compte du surcoût

Gain (dB) Gain (%) Gain (dB) Gain (%) MP DFT réelle + 0.43 - 5.67 + 0.30 - 3.97 Déconvolution + 0.45 - 5.87 + 0.34 - 4.38

TAB. 5.1 – Résultats Bjontegaard de la prédiction intra8×8basée déconvolution

5.4 Conclusion

Nous avons présenté dans ce chapitre l’équivalence dans le cas 1D de l’algorithme du Matching

Pursuit et celui proposé par A. Kaup et T. Aach, basé sur une déconvolution fréquentielle. Nous

pouvons cependant souligner une différence entre ces deux approches notamment dans le cas 2D. Le MP construit la prédiction à partir des données spatiales disponibles, sans avoir besoin de modéliser la zone à extrapoler. Dans la seconde approche, on modélise les données manquantes dans le domaine spectral puis on débruite les fréquences pertinentes (pour la reconstruction) en tenant précisément compte des données manquantes. Dans le cadre des représentations parcimonieuses, on reconstruit le signal à partir de briques élémentaires, les atomes, en se basant uniquement sur le voisinage connu. Dans le cas de la déconvolution, on commence par décomposer le signal, incluant la zone inconnue, sur les fonctions de base puis on retire le signal assimilé au bruit. La méthode demeure relativement complexe du fait de la convolution dans le domaine de Fourier.

Chapitre 6

Dictionnaires

Les dictionnaires représentent le coeur des représentations parcimonieuses. La qualité de la représentation obtenue, tant en terme de parcimonie que de similarité aux données traitées, dépend directement du choix en nombre et en variété des fonctions de base. En prédiction d’images, nous avons la contrainte de conserver un dictionnaire riche en fonctions à support étendu, afin d’être à même d’extrapoler une texture sur un domaine plus vaste que celui pour lequel elle est définie. Jusqu’à présent, nous avons présenté des résultats en prédiction basés sur l’usage de dictionnaire formés de fonctions harmoniques, telles que celles issues de la transformée en cosinus discrète ou de la transformée de Fourier discrète. Les résultats sont satisfaisants car nous avons observé une reconstruction acceptable des zones texturées au sein d’une image, ce qui manquait à la prédiction intra de la norme H.264 / AVC, basée sur des modes directionnels. Cependant, les structures rectilignes de l’image sont, quant à elles, particulièrement bien reconstruites à l’aide de ces modes directionnels. Notre prédiction parcimonieuse ne proposant pas, pour ces situations, une prédiction de meilleure qualité, la prédiction de la norme est quasiment systématiquement choisie. Nous avons ainsi voulu enrichir notre prédiction parcimonieuse, en proposant des solutions qui introduisent une notion d’anisotropie dans le traitement des données ou dans la nature des fonctions de base.

6.1 Adaptabilité des fonctions de base 6.1.1 Scan directionnel des observations

A défaut de créer un dictionnaire exhaustif, contenant le plus de directions possibles, nous nous sommes intéressés au cas connexe qui consiste à réorienter les données d’observations le long de directions privilégiées. Si on parcourt les pixels le long d’une trajectoire correspondant au motif contenu dans l’image, on a de forte chance de créer un vecteur d’observation yau sein duquel de nombreux pixels seront très corrélés entre eux (figure 6.1).

L’idée est ainsi de n’avoir besoin que des premiers atomes de la DCT, par exemple, en première ligne et colonne d’après la figure 6.1. On se soustrait indirectement à la contrainte d’avoir des atomes très variés et multi-directionnels. Cependant, nous sommes bien évidemment limités par le nombre d’orientations des parcours que nous définissons. Nous proposons d’utiliser six parcours directionnels (figure 6.2) : les parcours classiques horizontaux et verticaux ; un parcours diagonal et un autre anti-diagonal ; et deux autres parcours dont les directions forment un angle de22.5 et un angle de−22.5.

112 Dictionnaires