• Aucun résultat trouvé

Efficacité du débruitage

4.2 Performance de RTE-VD : comparaison avec l’état de l’art

4.2.1 Efficacité du débruitage

Dans un premier temps nous évaluons RTE-VD en termes d’efficacité du débruitage. Pour ce faire, nous reconstituons les conditions de la comparaison effectuée dans [29]. Pour les 7 séquences issues de la Derf’s Test Media Collection, nous comparons lePSNR

moyen sur les 100 premières images en fonction de la méthode de débruitage utilisée. Le tableau4.3 indique lesPSNRobtenus avec RTE-VD, STMKF, VBM3D et VBM4D.

Bruit Méthode crowd park_j pedestr station sunflo touchd tractor global

σ= 20 STMKF 26.25 25.59 28.34 26.66 26.97 28.87 25.37 26.70 RTE-VD 26.38 25.65 30.58 30.98 32.51 30.17 29.38 28.73 VBM3D 28.75 27.89 35.49 34.19 35.48 32.85 31.44 31.34 VBM4D 28.43 27.11 35.91 35.00 35.97 32.73 31.65 31.11 σ= 40 STMKF 20.80 20.75 20.70 20.41 20.70 20.86 19.80 20.56 RTE-VD 22.55 21.64 25.72 27.76 27.87 27.05 25.99 24.85 VBM3D 24.81 23.78 30.65 30.62 30.88 30.21 27.82 27.43 VBM4D 24.65 23.22 31.32 31.53 31.39 30.09 28.09 27.35

Table 4.3 – Comparaison duPSNRobtenu avec des méthodes de l’état de l’art et notre chaîne de traitement RTE-VD pour les 7 séquences considérées. Résultats pour 2 niveaux de bruit additionnel gaussien d’écart type σ.

Pour un bruit d’écart type de 20, le PSNR obtenu avec RTE-VD est en moyenne 2,5 dB sous celui obtenu avec VBM3D ou VBM4D. RTE-VD permet également d’obtenir un PSNR d’environ 2 dB supérieur à celui obtenu avec STMKF. Pour un bruit plus important, avec un écart type de 40, l’écart entre RTE-VD et VBM3D/4D reste aux environs de 2,5 dB tandis que l’écart avec STMKF se fait plus grand. Dans ce cas, RTE-VD permet d’obtenir un PSNR d’en moyenne 4 dB supérieur à celui de STMKF, avec un maximum de +7 dB obtenu sur les séquences station, sunflofower et touchdown. Ces résultats indiquent, qu’en termes d’efficacité de débruitage, RTE-VD se positionne entre

VBM3D/4D et son concurrent temps réel STMKF. La comparaison visuelle permet de confirmer ces résultats numériques.

La figure 4.6fournit une comparaison visuelle pour un extrait de la séquence

pedes-trians et pour un écart type du bruit de 40. Dans ce cas, on peut voir que VBM3D et VBM4D produisent effectivement un débruitage de meilleure qualité que RTE-VD. En revanche, l’image produite par STMKF est plus bruitée que celle produite par RTE-VD. L’efficacité de RTE-VD par rapport à STMKF est particulièrement sensible pour les éléments en mouvement. Une perte sensible de contraste, peut en revanche être observée sur les éléments statiques de la scène comme ici sur le panneau indiquant le nom de la rue. Cela semble venir du manque de précision dans l’estimation du flot optique pour les éléments statiques. Bien que les vecteurs vitesse calculés soient de très faible magnitude, ils n’en sont par pour autant nuls. Ce phénomène est susceptible d’engendrer un effet trouble sur les zones statiques de la vidéo. Nous pensons qu’un filtrage du flot pour réduire davantage la valeur des petits vecteurs pourra résoudre ce problème.

Les observations faites pour la séquence pedestrians sont assez représentatives des différentes observations que l’on peut faire sur des images arrêtées, pour l’ensemble des 7 séquences de la Derf’s Test Media Collection. Lors des comparaisons visuelles, il est également important de considérer l’observation des séquences vidéos dans leur ensemble. Dans ce cas, on observe toujours que les performances de débruitage de RTE-VD sont situées entre celles de VBM3D/4D et celles de STMKF. On peut voir également que pour certaines séquences, comme crowd ou park_joy, RTE-VD montre une baisse de ses performances. Cela est principalement dû aux mouvements de grande ampleur et aux fortes discontinuités présents dans ces scènes. En effet, les fortes discontinuités et les occlusions sont connues pour être un problème majeur lors de l’estimation du flot optique. De plus, dans cette configuration de RTE-VD, nous utilisons 3 échelles pour le calcul de flot. Les plus grands déplacements estimables sont donc de l’ordre de 23−1 = 7 pixels.

L’ensemble des séquences vidéo étudiées est disponible en téléchargement (≈2Go) à l’adresse suivante :http://www-soc.lip6.fr/~petreto/Download.html.

Dans le cadre des comparaisons visuelles, nous avons également considéré d’autres séquences que celles de la Derf’s Test Media Collection. Ces nouvelles séquences sont capturées à l’aide d’une caméra LHERITIER appelée Aether. L’idée est d’utiliser un niveau de bruit plus réaliste qu’un bruit gaussien additionnel. En effet, avec des capteurs haute performance, le bruit de lecture est si faible qu’il est possible d’obtenir des images exploitables avec uniquement quelques photons. Cependant, dans ces conditions, le bruit électrique du capteur devient visuellement significatif. Ce bruit engendré suit un modèle fixe ou répétitif. Cet aspect peut être particulièrement gênant pour le débruitage qui peut avoir tendance à accentuer le modèle du bruit. Le modèle du bruit peut se manifester sous différentes formes selon le capteur utilisé. Pour Aether, le bruit de capteur se manifeste sous la forme de ce que l’on appelle un bruit de lignes : d’une image à l’autre, le gain d’une ligne de pixels varie de façon périodique. La connaissance de ce phénomène nous permet de le prendre en compte et de l’intégrer à RTE-VD.

Origine Bruitée RTE-VD

STMKF VBM3D VBM4D

Figure 4.6 – Comparaison visuelle des résultats pour la séquence pedestrians (bruit :

σ = 40).

Les séquences supplémentaires capturées avec Aether sont de 2 types différents. Dans le premier cas, il s’agit d’une séquence prise de jour à laquelle a été ajouté un bruit proche de celui visible sur Aether grâce à un générateur de bruit déjà existant au sein de LHERITIER. Le générateur permet d’estimer l’importance du bruit à partir d’une luminosité générale choisie. Ici, nous avons considéré des éclairages ambiants de 150, 50 et 15 millilux. À titre de comparaison, on considère que la luminosité moyenne pendant une nuit de pleine lune est de 500 millilux. Cette approche permet de pouvoir comparer les résultats réalistes obtenus avec une vidéo d’origine non bruitée. Dans le second cas nous utilisons des vidéos réellement bruitées. Outre le fait de pouvoir obtenir ce type de résultats en se plaçant volontairement dans des conditions d’enregistrement défavorables, il est possible de recréer, de jour, des conditions de nuit grâce à l’utilisation de filtres de densité neutre (ND) et à la réduction du temps de pose. L’utilisation de cette dernière méthode permet d’obtenir des images réellement bruitées tout en gardant un temps de pose relativement court. Cela permet d’éviter le flou de bougé généralement présent dans les prises de vues de nuit avec des temps de pose longs. Décorréler le résultat du filtrage du flou de bougé permet d’éviter d’attribuer un effet de flou au filtrage qui serait en réalité causé par une pose longue.

La séquence prise de jour non bruitée est appelée simu_xxml où xx est le nombre de millilux choisis pour générer le bruit de la séquence. Les séquences capturées à l’aide de filtres ND sont appelées fausse_nuit0 et fausse_nuit1. Ces deux séquences représentent une action similaire mais fausse_nuit0 est capturée dans des conditions plus difficiles que

fausse_nuit1. L’ensemble de ces séquences est également disponible en téléchargement dans le lien fourni précédemment.

La figure 4.7 illustre les résultats obtenus pour la séquence simu_50ml. Le débrui-tage de RTE-VD apparaît encore une fois meilleur que celui de STMKF mais plus faible que celui de VBM3D/4D. La visualisation des vidéos permet cependant de mettre en avant l’influence du bruit de lignes. Ce dernier entraîne un effet d’ondulation particuliè-rement pénalisant pour VBM3D et surtout VBM4D. Visuellement, cet effet d’ondulation ressemble à ce que l’on pourrait observer en cas de perturbations atmosphériques. La prise en compte de ce bruit de capteur dans RTE-VD permet de limiter sont impact. La figure 4.8 présente un extrait des résultats obtenus dans le cas d’un bruit réel pour la séquence fausse_nuit1. Les observations faites avec la génération de bruit sont ici confirmées dans le cas d’un bruit réel. L’effet de turbulence engendré par VBM3D et VBM4D entraîne une perte de détails au niveau de l’individu qui est moins pénalisant avec RTE-VD.

En résumé, les résultats montrent que RTE-VD permet un débruitage significati-vement plus efficace que son concurrent temps réel STMKF mais reste en dessous des références de qualité que sont VBM3D et VBM4D. STMKF s’avère particulièrement inefficace dans les situations très bruités. Cela est dû à la nature de l’algorithme qui tend à diminuer la force du filtrage temporel en cas de variation trop importante d’une image à l’autre. Les méthodes VBM3D et VBM4D fournissent un débruitage nettement plus efficace que RTE-VD mais au prix d’un temps de calcul grandement supérieur.

Origine Bruitée STMKF RTE-VD VBM3D VBM4D

Figure 4.7 – Comparaison visuelle des résultats pour la séquence simu_50ml.

Origine STMKF RTE-VD VBM3D VBM4D

Figure 4.8 – Comparaison visuelle des résultats pour la séquence fausse_nuit1.

Afin de mieux évaluer le positionnement de RTE-VD par rapport à ces méthodes, nous comparons dans la section suivante, les différents temps de traitement nécessaires au débruitage.

Documents relatifs