• Aucun résultat trouvé

Dans cette section, nous passons rapidement en revue diff´erentes possibilit´es de codage mises en comp´etition pour le codage vid´eo, afin de d´eterminer nos axes de recherche pour l’introduction de nouveaux modules de codage par comp´etition.

2.3.1

Comp´etition de codeurs

Dans ce paragraphe, nous pr´esentons la comp´etition de modes de codages/codeurs. La majorit´e des r´ef´erences ´etudie des codages par objets. Les comp´etitions se situent donc `a “haut niveau”, dans le sens o`u ces codages sont parfois des codeurs vid´eo ou d’image ind´ependants.

L’utilisation de plusieurs types de codage est souvent appel´ee codage dynamique [RELB+97]. Son principe r´eside sur l’observation qu’une seule technique de codage ne peut ˆetre efficace pour toutes les applications [Fle99]. Le codage dynamique est une combinaison de multiples techniques de compres- sion activ´ees sur diff´erentes zones de l’image [RCLB+96]. Dans ces m´ethodes, une premi`ere phase de segmentation est g´en´eralement appliqu´ee. Ce type de m´ethode est inclus dans les m´ethodes de codage par objets. Dans [CPN04], un codage par objets utilisant quatre codeurs vid´eo mis en comp´etition est propos´e. Les quatre codeurs sont : le “3D model-based coder” (repr´esentation d’un GOP `a l’aide d’un mod`ele 3D), le “Sprite coder” (utilisation d’un mouvement param´etrique et de JPEG 2000 [PMCM01]), “2D+t wavelet coder” (un codeur ondelettes spatio-temporel) et “H.264/AVC object based coder” (H.264/AVC modifi´e pour ˆetre compatible avec le codage par objets). Pour chaque objet, la texture et l’information de mouvement sont cod´ees `a l’aide d’un de ces codeurs. Dans [REK97], une comp´etition entre diff´erents codages est aussi propos´ee. Chaque image est d´ecoup´ee en r´egions (union de blocs de tailles variables). Les mod`eles (codages) utilis´es sont : le mod`ele de compensation de mouvement (pr´ecision du mouvement au 1

2 pixel), le mod`ele du fond (pour les parties sans mouvement), mod`ele de textes et de graphiques (la r´egion est repr´esent´ee en binaire) et le mod`ele fractal (compression avec une transform´ee fractale). Les auteurs pr´ecisent que le mod`ele de fond est un cas particulier du mod`ele de compensation de mouvement. Notons que la segmentation en r´egions est faite `a l’aide d’une structure par arbre.

Dans [BB00], six codeurs consid´er´es comme ind´ependants sont mis en comp´etition. Chaque co- deur est charg´e de coder un “´ev´enement visuel”. Cet article est en relation avec le codage dynamique. Les six codeurs sont : “Gain Expert” (compense les diff´erences au mod`ele), “Remplacement Expert” (retire ou ajoute les objets contenus ou non dans le mod`ele), “Biais Expert” (code les pixels diff´erents entre le mod`ele et l’image), “Motion Expert” (code les d´eplacements spatiaux des objets), “Lighting Expert” (code les variations globales dans la luminosit´e) et “Additive expert” (code le bruit de l’image). Cet article est diff´erent de ceux de l’´etat de l’art car les “Experts” (les codeurs) ne sont pas charg´es de coder uniquement des objets. L’id´ee est que les codeurs propos´es sont charg´es de coder un ´ev´enement visuel et non une zone de l’image. Les codeurs pr´esent´es sont compl´ementaires au sens o`u ils peuvent ˆetre une suite de codage au sens “hybride”, ou compl´ementaires au sens du codage par objets. Par cons´equent, il est difficile de d´eterminer le niveau o`u a lieu la comp´etition entre les codeurs (est relativement flou). Cette description reste th´eorique et est pr´esent´ee comme un appel `a contributions.

Possibilit´es de codage par comp´etition 37

2.3.2

Comp´etition de pr´edictions

Dans la norme H.264/AVC [H.264/AVC], le codage de la texture se fait par pr´ediction, que ce soit pour exploiter les redondances spatiales ou temporelles. La recherche du meilleur r´esiduel de texture est, dans le sch´ema des standards vid´eo actuels, la partie du codage qui engendre le plus grand nombre de tests exhaustifs.

Pour exploiter les corr´elations spatiales, le codage pr´edictif Intra [FPR95] utilise plusieurs par- titionnements du macrobloc : 16×16, 8×8 et 4×4. Chacun de ces partitionnements a plusieurs pr´edicteurs et toutes ces pr´edictions sont mises en comp´etition. L’am´elioration du codage pr´edictif Intra est largement ´etudi´ee dans l’´etat de l’art, comme nous avons pu le voir dans le chapitre 1 de cette mˆeme partie. Toutes ces nouvelles m´ethodes sont syst´ematiquement mises en comp´etition avec les modes existants.

Pour exploiter les redondances temporelles, la norme utilise la compensation de mouvement avec plusieurs tailles de blocs [YC88] ce qui offre une meilleure segmentation du mouvement lorsque cela est n´ecessaire [YCC90]. Pour chaque taille de bloc, une comp´etition de pr´ediction de bloc est donc effectu´ee. Les meilleures pr´edictions pour chacun des partitionnements du macrobloc sont aussi mises en comp´etition. Les pr´edictions peuvent provenir du pass´e et du futur pour les slices B, et de plusieurs images de r´ef´erence [WZG99]. Dans le cas de l’exploitation des redondances temporelles, le partitionnement d’une image peut descendre au niveau pixel [CYC90].

2.3.3

Comp´etition de transform´ees

L’´etape de transformation est cruciale en compression d’image et de vid´eo. Elle permet de d´ecorr´eler le signal. Plusieurs transform´ees ont ´et´e utilis´ees dans le domaine de la compression et les deux plus connues sont la DCT et la transform´ee en ondelettes [ABMD92]. Ces transform´ees ont des caract´eristiques diff´erentes et une efficacit´e variable selon le contenu. Il est alors int´eressant de les mettre en comp´etition pour exploiter une efficacit´e de codage accrue. Dans [WK97], une comp´etition exhaustive entre la transform´ee DCT et la transform´ee en ondelettes au niveau bloc est impl´ement´ee. Les gains sont cependant faibles.

La norme H.264/AVC utilise deux tailles de transform´ee DCT, 4×4 et 8×8. L’utilisation de taille multiple de la transform´ee DCT est assez fr´equente dans l’´etat de l’art [MTI00]. Les premiers articles sur le sujet sont apparus dans les ann´ees 90 [Che89]. Dans [TG96], une comp´etition entre une DCT 1D et une DCT 2D est propos´ee pour coder les r´esiduels de texture engendr´es par la compensation de mouvement. Dans [Wie03], 4 transformations sont propos´ees : 4×4, 4×8, 8×4, 8×8. L’information concernant la taille de la transform´ee utilis´ee n’est pas envoy´ee au d´ecodeur car elle est adapt´ee aux partitionnements du marobloc. Dans [Val02] des tailles de DCT 4×4, 8×8, 16×16 sont propos´ees avec une quantification adapt´ee `a chacune d’elles, afin d’obtenir une distorsion ´equivalente. Notons que l’auteur utilise des tailles de blocs (carr´es) allant du 2×2 au 16×16. Comme nous l’avons vu dans le chapitre pr´ec´edent, l’outil APEC [NM06] met en comp´etition les transform´ees de la norme avec un mode de codage sans transform´ee. De plus, le nouveau mode de codage Intra int´egr´e dans le KTA propose aussi une transform´ee KLT en plus des DCT classiques.

comp´etitions de transform´ees. Dans [REK97], un codage utilisant la transform´ee DCT et un codage utilisant une transform´ee fractale [Jac92], sont utilis´es, cette derni`ere ´etant visiblement plus efficace pour le codage des contours [EWK95]. Dans [CPN04], plusieurs codeurs sont mis en comp´etition. Ils utilisent soit une transform´ee DCT soit une transform´ee en ondelettes.

2.3.4

Autres comp´etitions

Dans un codeur vid´eo, la comp´etition peut se situer `a d’autres ´etapes ou d’autres niveaux que ceux dont on a d´ej`a parl´e. Une analyse du mouvement entre deux images pour adapter le type des images (I, P, B) dans un GOP a ´et´e r´ealis´ee dans [LH97]. La mesure MSPE (Mean Square Prediction Error) est calcul´ee entre deux images successives pour d´eterminer les changements. En fonction de la valeur de cette mesure, l’image est cod´ee en I, P ou B. Le mˆeme but est recherch´e dans [YNYS99] o`u une adaptation de la structure du GOP est propos´ee. La taille du GOP et l’intervalle entre les images P sont d´etermin´es en fonction des caract´eristiques des images originales. Ils utilisent notamment l’activit´e et la variance induite par une simple compensation de mouvement pour chaque macrobloc, mais aussi la moyenne sur la luminance totale de chaque image.

Une comp´etition de pr´edicteurs de vecteurs mouvement est test´ee dans [DKBR99] entre trois pr´edicteurs spatiaux. On notera que la comp´etition de QP est autoris´ee dans la norme et a ´et´e int´egr´ee dans le KTA avec l’outil RDOQ [KYC08a]. De mˆeme, la matrice de quantification des r´esiduels de texture peut ˆetre l’objet d’une comp´etition comme dans l’outil AQMS [TC06], lui aussi int´egr´e dans le KTA. Enfin, une comp´etition d’orientations de blocs, pour am´eliorer l’efficacit´e de codage des r´esiduels du codage Intra et Inter, a ´et´e pr´esent´ee dans [Rob08].