• Aucun résultat trouvé

État de l’art sur l’évaluation de la qualité des images

2.2 Évaluation subjective

2.2.2 Bases de données d’images

2.2.2.2 Base de données d’images CSIQ

CSIQ (Categorical Subjective Image Quality) [25, 26] est une base de données d’images conçue par le laboratoire d’analyse de la qualité et de perception d’images, de l’Université de l’État d’Oklahoma3; parue en 2010. Elle est constituée de 30 images de référence, prises pour la plupart au service du parc national des États-Unis. Ces images ont été choisies pour couvrir cinq catégories : animaux, paysages, personnes, plantes et scènes naturelles. Les images de référence de cette base de données sont présentées dans la Figure 2.7.

Chaque image de référence est déformée grâce à six (06) types de distorsions présentés dans le Tableau 2.5, avec quatre (04) ou cinq (05) niveaux pour chaque type de distorsion. Soit un total de 866 images déformées résultant de l’opération. Elles sont toutes stockées au format « Portable Network Graphics » (.P N G), et redimensionnées en une résolution de 512×512 pixels.

2. Une valeur hors de l’intervalle de largeur4de l’écart type autour de la valeur moyenne de l’image 3. Computational Perception and Image Quality Lab

Table 2.5 – Types de distorsions dans la base de données CSIQ

Type de distorsion

1 Compression JPEG2000

2 Compression JPEG

3 Changement de contraste global (global contrast decrements)

4 Bruit gaussien rose (additive pink Gaussian noise)

5 Bruit gaussien blanc (additive white Gaussian noise)

6 Flou gaussien (Gaussian blurring)

Les images déformées sont évaluées subjectivement en fonction d’un déplacement li-néaire des images sur quatre (04) moniteurs LCDidentiquement calibrés, de résolution 1920×1200, placés côte à côte et à distance d’observation égale (70cm) de l’observateur. Les toutes les images s’affichant simultanément sur quatre moniteurs doivent être des images déformées d’une même image de référence. Toutes les images déformées d’une image de référence doivent apparaitre au moins une fois dans le même stimulus d’éva-luation. Ainsi, toutes les images déformées d’une même image de référence seront placées les unes par rapport aux autres en fonction de leur qualité visuelle. La qualité de chaque image est déterminée en fonction des différents rangs obtenus au cours l’expérience. 5 000 évaluations subjectives ont été effectuées, par 35 observateurs humains.

La qualité d’une image dans cette base de données CSIQ est décrite par son score moyen d’opinions différentiel (DM OS) obtenu en évaluant la moyenne des scores sub-jectifs obtenus par cette image durant l’expérience. Les DMOS sont tous compris entre 0 et 1, où 0 dénote une excellent qualité d’image et 1 la qualité d’image moins bonne. 2.2.2.3 Base de données d’images TID2013

La base de données d’images TID2013[27, 4] est une version évoluée parue en 2013 de la base de données d’images TID2008[28, 29], destinées à l’évaluation des mesures de la qualité visuelle. Elles ont été toutes les deux mises au point au sein de l’Université Technologique de Tampere4 en Finlande. TID2013 contient 25 images de référence, dont 24 ont été prises de la base de données d’images Kodak [30], et la 25éme image a été construite artificiellement. Les images de référence de cette base de données sont pré-sentées dans la Figure 2.8. Certains contenus de ces images ont des textures différentes, tandis que d’autres sont homogènes. Toutes les images de cette base de données ont été redimensionnées, elles ont toutes la même résolution qui est de 512×384 pixels, et sont stockées au format Bitmap (.BM P) sans aucune compression.

Toutes les images de référence de la base de données T ID2013 ont été déformées à partir de 24 types de distorsions décrites dans le Tableau 2.6, avec cinq (05) niveaux

Table 2.6 – Types de distorsions utilisées dans la base de données TID2013

Type de distorsion

1 Additive white Gaussian noise

2 Additive noise in color components is more intensive than additive noise in the luminance component

3 Spatially correlated noise

4 Masked noise

5 High frequency noise

6 Impulse noise 7 Quantization noise 8 Gaussian blur 9 Image denoising 10 JPEG compression 11 JPEG2000 compression

12 JPEG transmission errors

13 JPEG2000 transmission errors

14 Non eccentricity pattern noise

15 Local block-wise distortions of different intensity

16 Mean shift (intensity shift)

17 Contrast change

18 Change of color saturation

19 Multiplicative Gaussian noise

20 Comfort noise

21 Lossy compression of noisy images

22 Image color quantization with dither

23 Chromatic aberrations

Figure2.8 – Images de référence de la base de données TID2013

pour chaque distorsion ; soit un total de 3000 images déformées (25 images de référence

×24 types de distorsions×5 niveaux par distorsion).

Au total 524 340 évaluations de la qualité visuelle d’images ont été effectuées, décou-lant de 971 expériences réalisées avec des observateurs humains bénévoles issus de cinq (05) pays différents (Finlande, France, Italie, Ukraine et États-Unis). Chacune des expé-riences dure en moyen 17 minutes (ce qui est <30 minutes, comme recommandées par l’ITU), soit en moyenne 540 évaluations par observateurs. Dans le processus d’évalua-tion, une paire d’images toutes deux déformées provenant de la même image de référence, apparaît sur la partie haute de l’écran, tandis que sur la partie basse de ce même écran, apparaît l’image de référence à partir de laquelle ont été construites les images déformées à évaluer ; comme présenté dans la Figure 2.9. Il est demandé à l’observateur de choisir la meilleure5 des 2 images déformées qui lui sont présentées. Après la sélection, de nouvelles images déformées apparaissent, et le processus d’évaluation recommence. La décision de l’observateur doit être claire et rapide à savoir : 03 secondes pour décider, sinon le test passe aux images suivantes. Chaque observateur n’évalue que les images déformées d’une même image de référence. Chaque image déformée participe au même nombre de com-paraisons par paire (soit 09 comcom-paraisons) ; et lorsqu’une image est choisie lors de la comparaison, elle gagne un point. A la fin de l’expérience, les points donnés à chacune des images déformées sont sommés pour déterminer le score final de l’expérience pour de cette image. Au début de l’expérience, les images apparaissant dans les évaluations par paire sont sélectionnées aléatoirement ; mais au bout d’un certain nombre d’expériences aléatoires, les images déformées ayant approximativement le même score sont comparées entre elles.

Figure 2.9 – Capture d’écran de la méthodologie d’évaluation de la base TID2013

Table 2.7 – Tableau récapitulation des bases de données d’images

BD Date P rotocole Nobs Nexp Nr´ef Nd´eg Nd´ef Echelle´

LIVE 2006 SSCQS 24 25 000 29 5 779 0 - 100

CSIQ 2010 Comparatif 35 5 000 30 6 866 0 - 1

TID2013 2013 Comparatif 971 524 340 25 24 3 000 0 - 9 Les résultats bruts obtenus lors des expériences de comparaison sont sauvegardés, et les données aberrantes sont exclues de l’étude. Les données restantes sont combinées entre elles pour évaluer le score d’opinions moyen (M OS) des observateurs. Pour la base de données d’image TID2013, le M OSest compris entre 0 et 9, cependant il ne dépasse pas 7.5 pour les images déformées étudiées dans cette base de données. Plus l’image est bonne, plus son score subjectifM OS est élevé.