Le format JPEG2000 - Transition vers le cinéma numérique : Contributions pour le cinéma d’art e

Le JPEG2000 correspond à la partie 1 du standard ISO 15444, qui a été publié en 2000. Ce format comporte un mode sans perte et un autre avec pertes.

Bien que nous ayons uniquement à nous préoccuper du décodage d’images JPEG2000, nous présentons ici le format JPEG2000 du point de vue du codage. Ce codage permet de passer d’une image à un fichier binaire compressé. Le taux de compression est un paramètre clé du codage, mais au moment du décodage, lorsque nous devrons décoder un fichier binaire compressé au format JPEG2000, ce taux de compression nous sera imposé.

Nous présentons ci-après les étapes du codage par l’algorithme JPEG2000. Le déco- dage d’une image JPEG2000 consistera à suivre les mêmes étapes dans l’ordre inverse et à appliquer, à chaque étape, la transformation inverse. Mais si certaines étapes du codage ne sont pas inversibles (par exemple la quantification), cela causera inévitablement des pertes au moment du décodage.

4.2.1 D´ecoupage en tuiles et changement d’espace colorim´etrique

L’élément de départ à coder est l’image, qui est divisée en plusieurs parties appelées « tuiles » (tiles). Une tuile correspond à une zone spatiale de l’image. Une image peut être constituée d’une ou de plusieurs tuiles.

Les images couleur comportant trois composantes, il en va de même pour les tuiles. Avant d’appliquer une transformation en ondelettes à chaque composante couleur d’une tuile, appelée « composante de tuile » (tile-part), on procède à un changement d’espace colorimétrique. En l’occurrence, on passe de l’espace RGB (rouge-vert-bleu) à l’espace YCbCr (luminance-chrominances), et ce afin de décorréler les canaux. En effet, il est connu que, de manière générale, la compression de données est d’autant meilleure que les données sont moins corrélées. Il existe deux types de changements d’espace colo- rimétrique, inversible (Reversible Component Transformation) ou non inversible (Irre- versible Component Transformation), qui sont utilisées, respectivement, pour le codage sans perte ou avec pertes.

4.2.2 Transformation en ondelettes discr`ete

La transformation en ondelettes discrète, ou Discrete Wavelet Transform (DWT), existe elle aussi sous deux formes : inversible ou non inversible. Les ondelettes 5/3 de Le Gall sont utilisées pour la compression sans perte. Pour atteindre de meilleures per- formances de compression (avec pertes), les ondelettes 9/7 de Daubechies sont utilisées [5]. Dans les deux cas, la partie 1 de la norme JPEG2000 impose l’utilisation de filtres de type lifting-based. L’algorithme précis pour la transformation en ondelettes discrète (inversible ou non inversible) est décrit dans le chapitre F2 de [20]. Enfin, toutes les DWT dont il est question sont bidimensionnelles.

La figure 4.1 illustre les premières étapes du codage JPEG2000 : sur cet exemple, deux DWT successives sont appliquées à la première composante (canal Y) d’une tuile

de l’image d’origine. Par souci de clarté, nous avons agrandi le résultat des DWT, alors que sa taille est exactement la même que celle de la composante de tuile dont il provient. En d’autres termes, l’ensemble des « coefficients d’ondelettes » obtenus en appliquant deux DWT à l’ensemble des composantes des différentes tuiles (ici, il y a quatre tuiles) a exactement la même taille que l’image d’origine.

Image

Tuile

Comp Y

Comp Cb

Comp Cr

DWT (N=2)

Figure 4.1 – Premi`eres ´etapes du codage JPEG2000.

La DWT est utilisée pour obtenir plusieurs « niveaux de décomposition » : une DWT donne une image de définition quatre fois plus faible. Chaque niveau de décomposition comporte trois « sous-bandes » fréquentielles, notées xHL, xLH et xHH au niveau de

Frontière de code block Frontière de precinct Frontière de sous-bande

1

2 3 4

5

6 7 8

9 10

11 12

Sous-bande 2HH

Sous-bande 2HL

Sous-bande 2LH

1HL

1HH

1LH

LL

Figure 4.2 – Code blocks et precincts apr`es application de deux DWT à une composante de tuile. Cet exemple comporte trois niveaux de décomposition. La taille d’un code block est toujours la même, mais celle d’un precinct peut dépendre du niveau de décomposition. Par exemple, les six precincts de la sous-bande LL sont plus petits que ceux des niveaux supérieurs : il sont composés chacun d’un seul code block.

décomposition x, à l’exception du niveau de décomposition 0 (basses fréquences), qui comporte une seule sous-bande notée LL. La figure 4.2 donne l’exemple d’une composante de tuile à laquelle deux DWT ont été appliquées. Chaque niveau de décomposition contient des sous-bandes composées de coefficients qui décrivent les caractéristiques en fréquences spatiales (verticales et horizontales) de la composante de tuile.

Après application des transformations en ondelettes, chaque sous-bande est découpée en code blocks. Il s’agit d’éléments rectangulaires, dont chacune des dimensions est égale à une puissance de 2. Un precinct est un ensemble de code blocks correspondant aux différentes sous-bandes de même niveau de décomposition, couvrant une même zone spatiale. Sur l’exemple de la figure 4.2, les code blocks 1, 2, 3, 4 de la sous-bande 2HL sont regroupés avec les code blocks de numéros 5 à 8 de la sous-bande 2LH et avec les code blocks de numéros 9 à 12 de la sous-bande 2HH, pour former un precinct. On voit également qu’un precinct de seulement six code blocks est construit à partir des sous-bandes 1HL, 1LH et 1HH, à cause de la forme rectangulaire de la tuile.

4.2.3 Quantification des coefficients d’ondelettes

La quantification est un procédé qui, de fa¸con générale, diminue la précision des données. Elle permet de réduire la dynamique des coefficients d’ondelettes, et donc d’améliorer la compression. Pour le codage sans perte, il ne doit bien sûr pas y avoir de quantification.

Pour le codage avec pertes, les coefficients sont quantifiés par la méthode dead zone scalar quantifier, qui consiste à mettre à 0 les coefficients inférieurs en valeur absolue à un seuil, afin de réduire la dynamique des données (voir [38], page 43).

4.2.4 Codage entropique des code blocks (Tier-1)

Lors des transformations en ondelettes, les pixels ne sont pas compressés : ils sont réorganisés de manière fréquentielle afin d’atteindre de meilleurs taux de compression. C’est ce qui est fait à l’étape Tier-11 _{: à chaque code block est appliqué un « codage} entropique », indépendamment des autres code blocks.

L’étape Tier-1 utilise un codeur arithmétique (codeur MQ) et un codeur contextuel « par plan de bits » (EBCOT). L’algorithme Embedded Block Coding with Optimized Truncation (EBCOT) a été proposé par Taubman en 2000 [48]. Son fonctionnement étant complexe, nous renvoyons le lecteur à [49] pour une description détaillée.

4.2.5 Cr´eation du fichier binaire (Tier-2)

Cette étape permet de contrôler le taux de compression et d’organiser le « train de bits » (bitstream) du format JPEG2000. Au moment de la compression, le train de bits peut être tronqué de différentes fa¸cons, ce qui permet de choisir le taux de compression. Le fichier binaire est organisé de manière hiérarchique, de l’image vers les code blocks. À chaque niveau, il est composé de deux parties : un en-tête et des données. Au plus haut niveau, il comporte l’en-tête principal et les données correspondant aux différentes composantes de tuiles, qui elles-mêmes comportent chacune un en-tête, suivi de données compressées.

L’en-tête principal du fichier binaire et celui d’une composante de tuile sont construits selon le même modèle : ils contiennent des marqueurs indiquant les paramètres de l’image (taille, nombre de composantes, . . .). Ces marqueurs peuvent être obligatoires ou option- nels.

Les données compressées de chaque composante de tuile sont organisées en « pa- quets ». Un paquet correspond aux données associées à un precinct. L’élément le plus petit, dans la création du fichier binaire, est le code block. Le train de bits associé à chaque code block contient les données binaires issues de la compression du codeur entropique.

La figure 4.3 met en correspondance la décomposition de l’image effectuée par le codage JPEG2000 et l’organisation des données compressées dans le fichier binaire associé.

Figure 4.3 – Correspondances entre la décomposition de l’image effectuée par le codage JPEG2000 et l’organisation des données compressées dans le fichier binaire (E signifie « en-tête »).

4.2.6 D´ecompression du format JPEG2000

Lors du décodage d’une image compressée au format JPEG2000, le train de bits correspondant à chaque code block est extrait du fichier binaire par le Tier-2, qui extrait également du train de bits le nombre de « passes de codage » de ce code block. Le Tier-1, qui re¸coit les données compressées fournies par le Tier-2, effectue la décompression à proprement parler (cf. figure 4.4).

Les coefficients d’ondelettes de chaque code block sont décompressés par « décodage entropique ». Le principe de fonctionnement du Tier-1 est le même pour le codage et pour le décodage : EBCOT code indépendamment chaque code block d’un paquet. Le décodeur entropique arithmétique adaptatif binaire basé sur le contexte (context-based adaptive binary arithmetic), appelé « décodeur MQ », est issu du standard ISO JBIG2.

Dans le document Transition vers le cinéma numérique : Contributions pour le cinéma d’art et essai (Page 62-66)