• Aucun résultat trouvé

4.5 Résultats expérimentaux dans le cadre H.264 / AVC

4.5.10 Application : raffinement de la prédiction inter - image

4.5.10.2 Dé-crossfading

Les fading sont des effets appliqués sur plusieurs images, en général pour marquer des transitions entre différentes scènes d’une vidéo. Les corrélations temporelles entre images successives sont alors très faibles, ce qui peut perturber le processus de prédiction inter-images.

FIG. 4.24 – Situation de crossfading

Prenons l’exemple expérimental suivant présenté en figure 4.24. L’image courante est l’image

Barbara. L’image de référence que l’on suppose être utilisée par l’estimation de mouvement

correspond à une image où les images Lena et Barbara ont été mélangées en proportion choisie. Sur cette figure, l’image Barbara est pondérée d’un facteur de 0.25 par rapport à Lena. Si bien que l’image de référence ici présentée, correspond à un crossfading de ces deux images.

L’objectif de cette étude est d’évaluer les performances des représentations parcimonieuses, dans le cadre d’une application de dé-crossfading pour améliorer la prédiction inter-images. Dans

92 Représentations parcimonieuses adaptées à la prédiction d’image

ces cas particuliers de crossfading, la norme ne possède comme outil que la prédiction pondérée (évoquée en section 1.6.3.3), laquelle est plutôt dédiée au phénomène de fading. En ce qui nous concerne, l’idée est de corriger la valeur des pixels issus de la référence, bruitée par le crossfading. Nous proposons une approche similaire à l’application précédemment présentée, le débruitage de la prédiction inter. L’enjeu est de réussir à extraire du bloc de prédiction inter bruité, les données correspondant uniquement à l’image courante, ici Barbara, en se basant sur la connaissance du voisinage local.

FIG. 4.25 – Principe du dé-crossfading basé sur les représentations parcimonieuses

Nous nous sommes positionnés dans un schéma non-réaliste dans le sens où nous avons rapatrié les pixels colocalisés de l’image de référence et non la prédiction inter issue de l’estimation / compensation de mouvement. Le but de cette expérimentation est principalement de présenter une autre application possible de la prédiction parcimonieuse. La figure 4.25 montre sur un exemple, les données utilisées pour générer notre prédiction : on exploite simultanément les pixels du voisinage causal de l’image courante (Barbara) et ceux correspondant au bloc à prédire, en colocalisé dans l’image de référence (ici, Lena et0.25% de Barbara).

Nous présentons en figure 4.26, les images de prédiction obtenues pour différentes valeurs de mélange : 15 %, 25 % et 75 % de Barbara. Pour évaluer de manière approfondie, les performances de cette technique, il faudrait mettre cette prédiction en concurrence avec les méthodes couramment employées pour résoudre ce type de problème. L’avantage de notre approche est de faire une compensation d’illumination fine. Le processus de sélection des atomes permet de ne représenter que les données pertinentes, tout en corrigeant des défauts d’illumination par le biais des facteurs de pondération, contenus dans la représentation parcimonieusex. On peut supposer que les résultats soient meilleurs que ceux obtenus via des techniques de compensation globale dont le terme correctif est unique pour l’ensemble des pixels du bloc.

Nous avons néanmoins voulu obtenir des résultats permettant de jauger le potentiel de la technique, dans un schéma de compression d’images. Une première approche pour évaluer l’apport de la technique est de se comparer à la prédiction inter image crossfadée. Dans le même esprit que pour le raffinement de la prédiction inter (section 4.5.10.1), nous avons substitué la prédiction extrait de l’image de référence crossfadée à un mode intra de la norme.

Les résultats que nous obtenons, présentés dans le tableau 4.12, sont assez modestes. Les tendances les plus intéressantes ont été observées, sans grande surprise, en prédiction4×4. Pour un facteur de crossfading de0.25, nous observons un gain de0.31dB en qualité et une diminution de débit de3.53%. La petite taille des blocs permet de récupérer de manière assez précise le signal utile, en l’occurence,Barbara. Cependant le surcoût lié à notre prédiction est prohibitif au vue du nombre de blocs4×4présents dans cette image de dimensions512×512.

Résultats expérimentaux dans le cadre H.264 / AVC 93

15 % de Barbara

25 % de Barbara

75 % de Barbara

Références Prédictions

FIG. 4.26 – Résultat du dé-crossfading basé sur les représentations parcimonieuses en prédiction

94 Représentations parcimonieuses adaptées à la prédiction d’image

Sans surcoût Avec surcoût

Arrêt EQM Prédiction Facteur Gain (dB) Gain (%) Gain (dB) Gain (%)

4×4 15 % + 0.23 - 2.27 - -25 % + 0.31 - 3.53 - -75 % + 0.40 - 5.15 - -8×8 15 % + 0.19 - 2.53 + 0.13 - 1.72 25 % + 0.23 - 2.96 + 0.15 - 1.90 75 % - 0.72 + 5.35 - 1.07 + 9.65

Sans arrêt EQM Prédiction Facteur Gain (dB) Gain (%) Gain (dB) Gain (%)

4×4 25 % + 0.20 - 2.38 -

-8×8 25 % + 0.12 - 1.53 -

-TAB. 4.12 – Résultats Bjontegaard concernant le dé-crossfading

les performances, sans critère d’arrêt supplémentaire, ici basé sur l’EQM. Rappelons que dans ce cas de figure, l’algorithme itère jusqu’à ce que l’énergie de l’erreur de reconstruction, sur le voisinage causal, soit inférieure à un seuil, préalablement fixé. Dans ce contexte, les performances en prédiction 4×4, avec ce seuil fixé à35, diminuent pour n’avoir plus que0.20dB de gain en qualité et une diminution de2.38% en débit.

Les performances du dé-crossfading parcimonieux en prédiction 8 × 8 sont encore plus discutables. Après prise en compte du surcoût, on atteint une hausse de0.15dB en qualité et une perte de1.90% en débit, pour un facteur de crossfading de0.25.

D’un point de vue purement visuel, les images de prédiction dé-crossfadée que nous avons obtenues, pouvaient laisser présager des résultats intéressants dans le cadre de la compression. Il s’avère que les gains Bjontegaard obtenus ne sont pas aussi élevés que nous pouvions l’espérer. On peut néanmoins imaginer utiliser cette technique dans un autre cadre, différent de la compression où l’enjeu majeur serait la séparation de signaux ou encore des applications de débruitage.