• Aucun résultat trouvé

Lien avec l’analyse en composantes indépendantes

5.2 Gain de codage généralisé

5.2.4 Lien avec l’analyse en composantes indépendantes

, (5.11)

5.2.4 Lien avec l’analyse en composantes indépendantes

Un problème courant rencontré dans divers domaines comme l’analyse de données, le traite-ment du signal et la compression, est de trouver une représentation convenable de données multi-dimensionnelles. Pour des raisons de simplicité, une telle représentation est en général recherchée en appliquant une transformation linéaire aux données originales. Par exemple, on connaît depuis longtemps l’analyse en composantes principales, dont la matrice de changement de repère corres-pond à la transformation dite de Karhunen-Loève (TKL) dans les livres de codage, et qui donne une représentation où les composantes des données sont deux à deux décorrélées. Plus récemment, est apparue l’analyse en composantes indépendantes (ACI), pour laquelle la représentation recherchée est celle qui minimise l’information mutuelle entre les composantes des données. Parmi les méthodes existantes de séparation aveugle de sources ou d’analyse en composantes indépendantes, celles basées sur la minimisation de l’information mutuelle entre les sources estimées sont les plus appropriées au problème de codage (sous réserve de les modifier pour tenir compte du deuxième terme du cri-tère C(A)), car elles ne supposent pas que les observations sont obtenues à partir d’un mélange instantané de sources indépendantes éventuellement bruité. Grâce à l’aide précieuse de Dinh-Tuan Pham, avec Michel Narozny nous avons modifié son algorithme d’ACI, ICAinf (IEEE Trans. Signal Processing, 52, 10, 2690–2700, 2004) qui retourne une matrice A minimisant l’information mutuelle I(Y1; . . . ; YN) entre composantes transformées via une méthode de descente de gradient relatif de type quasi-Newton, pour construire deux algorithmes : OrthICA et GCGsup, qui maximisent le gain de codage généralisé. Le premier impose à la matrice de séparation d’être orthogonale et l’autre est sans contrainte [23, 7].

Nous avons fait une analyse statistique des coefficients transformés (pour différentes transforma-tions dont celles retournées par OrthICA et GCGsup) et une étude comparative à tous les débits, des transformations en codage avec pertes en s’assurant que l’allocation de bits entre quantificateurs est optimale.

Sur des signaux synthétiques nous avons obtenu des gains de codage importants (plus d’un bit par échantillon) par rapport à la TKL [23, 7]. Les premiers résultats obtenus sur des données réelles étaient moins encourageants, mais les derniers apparaissant dans le rapport de thèse de Michel Narozny et dans [7] le sont.

Toutefois, le codage par transformée d’images fixes, passant par une étape de découpage en blocs deux à deux disjoints de l’image, n’a plus la faveur des utilisateurs de codeurs d’images à cause des effets dits de blocs (apparition des frontières des blocs sur l’image reconstruite) à très bas débits. Le codage en sous-bandes (par exemple après une décomposition en ondelettes dyadique) est préféré, c’est ainsi que le récent standard JPEG2000 a supplanté l’ancien JPEG. Il serait plus intéressant, me semble-t-il, d’étudier des bancs de filtres associés à une décomposition dyadique pyramidale et optimaux (sous certaines hypothèses) en codage. Cela pourrait faire l’objet de futures recherches.

Chapitre 6

ACI appliquée au codage des images

multicomposantes

6.1 Introduction

Grâce à l’Action Concertée Incitative Masse de Données, qui a accepté de financer le projet ACI2M dont j’étais le coordinateur, nous avons pu poursuivre les travaux de Michel Narozny, béné-ficiant ainsi du financement d’une thèse et des compétences de nos partenaires, spécialistes de haut niveau aussi bien en analyse en composantes indépendantes qu’en compression de données. La thèse d’Isidore Paul Akam Bita, dont j’ai été co-directeur avec Dinh-Tuan Pham, traite de l’application de l’analyse en composantes indépendantes (modifiée) au codage d’images multi- ou hyper-spectrales. Dans la continuité des travaux de Michel, Isidore Paul a commencé par associer des transformations à base d’analyse en composantes indépendantes pour réduire la redondance spectrale à des décomposi-tions en ondelettes bi-dimensionnelles pour réduire la redondance spatiale. Les résultats obtenus ont donné lieu à trois présentations dans des ateliers ([40, 39, 37]), quatre articles dans des conférences internationales avec comité de lecture ([23, 38, 20, 17]) et la publication d’un papier long ([5]) dans la revue Signal Processing. Ces travaux se sont poursuivis après la thèse, conduisant à trois publications dans des conférences internationales avec actes et comité de lecture ([16, 14, 13]), à la publication d’un papier court ([4]) dans la revue Signal Processing et à la préparation d’un autre papier court à soumettre dans une revue [50].

La deuxième partie de la thèse de Paul a porté sur l’étude d’un modèle de mélange convolutif appliqué à la compression de données (en particulier d’images multicomposantes), les résultats ob-tenus ont fait l’objet d’une présentation dans un congrès avec actes et comité de lecture ([21]) et à la rédaction d’un article long [49] à soumettre pour publication dans une revue internationale. Les résultats prometteurs obtenus n’ont pas encore été exploités à leur juste valeur.

Les motivations du sujet de thèse d’Isidore Paul reposent d’une part sur une demande réelle de méthodes efficaces de compression d’images multispectrales et hyperspectrales, dont l’utilisation diverse et variée se répand dans de nombreux secteurs d’activité ; et d’autre part sur l’intérêt scien-tifique d’étudier de nouvelles méthodes de codage d’images dans le but de mieux comprendre les systèmes de codage rencontrés dans la Nature, par exemple dans le cerveau.

Les composantes d’une image multi-composante représentent généralement la même scène avec différentes vues dépendant de la longueur d’onde, à d’éventuels légers décalages près (correspondant au phénomène de déregistration). Il existe ainsi une forte dépendance entre les composantes, dite redondance spectrale et dans chaque composante, comme toute image, une forte redondance spatiale entre pixels voisins. Ces dernières décennies, différentes solutions ont été proposées pour réduire les

redondances, spatiale et spectrale, en compression d’images multicomposantes. Une solution assez répandue consiste à appliquer deux transformations distinctes, une par type de redondance. Par exemple, chaque composante subit une décomposition en ondelettes 2D pour diminuer la redondance spatiale et la spectrale est réduite par une application linéaire entre composantes. Une autre solution consiste à appliquer une décomposition en ondelettes 3D. Ces deux approches sont compatibles avec la partie 2 du standard JPEG2000.

Nous nous sommes focalisés dans un premier temps sur la première approche en étudiant trois schémas de compression (dont l’un est compatible JPEG2000), pour lesquels nous avons explicité un critère que doit minimiser une transformation optimale et donné deux algorithmes qui retournent une matrice minimisant le critère, l’un avec la contrainte d’une matrice orthogonale et l’autre sans autre contrainte que d’être inversible.

Documents relatifs