Synth` ese et compression d’images par pyramide de surfaces

In document The DART-Europe E-theses Portal (Page 35-39)

a un affichage), le r´esultat pour unσM donn´e est obtenu en temps r´eel ; un utilisateur peut ainsi `a l’aide d’une souris modifier la valeur d’un curseurσM plusieurs fois par seconde et voir les d´etails apparaˆıtre ou disparaˆıtre, mˆeme pour des images de grande taille. Les figures2.4et2.5comparent les premiers niveaux d’une pyramide avec des r´esultats de la pyramide multir´esolution obtenus pour plusieurs valeurs de σM. L’application graphique qui impl´emente l’algorithme de la pyramide irr´eguli`ere et celui de la pyramide multir´esolution peut ˆetre t´el´echarg´ee `a l’adresse suivante :

http ://www.gipsa-lab.inpg.fr/∼pascal.bertolino/software/waips.exe

Algorithme 3: Proc´edure r´ecursive Diviser(sommet, niveau) Donn´ees: unsommetappartenant `a unniveau

pourchaque filsf dusommetfaire siσ(f)> σM alors

Diviser(f, niveau−1) ; sinon

pourchaque pixelpdontf est le sommet r´ecepteur faire sommet r´ecepteur final(p) =f ;

fin fin fin

(a) Image originale (b) Niveau 1 (c) Niveau 2 (d) Niveau 3

Figure2.4 – Les premiers niveaux d’une pyramide classique

2.6 Synth` ese et compression d’images par pyramide de surfaces

Dans cette section, je pr´esente le travail de master de Tien Sy Nguyen qui montre que la pyramide irr´eguli`ere est un ou-til flexible et versaou-tile. Dans cette recherche, nous d´esirons am´eliorer la fa¸con dont les r´egions sont mod´elis´ees et ´egalement envisager d’autres finalit´es que la segmentation.

2.6.1 Ajustage de surface et mod´ elisation param´ etrique

Dans sa version initiale, la pyramide mod´elise le contenu de chaque r´egion par une couleur moyenne et un ´ecart-type. Bien que pratique et justifiable, cette mod´elisation classique, utilis´ee comme crit`ere de

2.6. SYNTH `ESE ET COMPRESSION D’IMAGES PAR PYRAMIDE DE SURFACES 29

(a)σM = 12 (b)σM = 15 (c)σM = 20 (d)σM = 29

Figure2.5 – Quelques r´esultats d’une pyramide multir´esolution

fusion poss`ede des limites pour repr´esenter des r´egions de type d´egrad´e ou textur´e. Ici, nous nous sommes int´eress´es aux r´egions d´egrad´ees en nous inspirant des travaux de Besl et Jain [BJ88] qui segmentent des images de profondeur en consid´erant l’image monochrome comme un relief. Le contenu de chaque r´egion est ainsi mod´elis´e par une surface d’ordre 1, 2, 3 ou 4 qui peut repr´esenter un plan, une surface minimale, un sommet, un puits, une crˆete, une vall´ee, une selle crˆete ou une selle vall´ee. Les auteurs utilisent des polynˆomes bi-vari´es repr´esentant une surface `a l’aide de 3 `a 15 param`etres en fonction de la complexit´e du relief de la r´egion (´equation2.1).

f(n, ~a;x, y) =a00+a10x+a01y+a11xy+a20x2+a02y2+a21x2y+a12xy2+a30x3

+a03y3+a31x3y+a22x2y2+a13xy3+a40x4+a04y4 (2.1) nest l’ordre du mod`ele (1, 2, 3 ou 4) auquel correspond un vecteur de param`etres~a: 3 param`etres d´efinissent une surface plane, 6 param`etres une surface bi-quadrique, 10 param`etres une surface bi-cubique et 15 param`etres une surface bi-quartique.

Dans leur algorithme, un ´etiquetage des pixels de l’image est r´ealis´e selon le signe de courbure de la surface locale. Il fournit une partition grossi`ere qui est ensuite ´erod´ee pour donner des germes utilis´es dans une croissance de r´egion bas´ee sur la mise en correspondance de surfaces d’ordre appropri´e. Il est `a noter que le r´esultat final n’est pas une segmentation en tant que telle puisqu’il y subsiste g´en´eralement un nombre plus ou moins important de pixels non ´etiquet´es (trous).

En s’inspirant de ce mod`ele, nous d´esirons d’une part approcher au mieux le relief des r´egions mais

´

egalement utiliser le mod`ele dans la pyramide irr´eguli`ere comme crit`ere de fusion. Nous donnons ici les pr´emisses de ce travail qui nous paraˆıt tr`es prometteur. Notre but est triple :

• utiliser un crit`ere de segmentation de plus haut niveau

• synth´etiser l’image originale `a partir d’une de ses segmentations

• proposer une nouvelle technique pour la compression d’image

2.6.2 Crit` ere de similarit´ e surfacique

Dans cette partie, nous rempla¸cons le crit`ere de similarit´e classique de la pyramide irr´eguli`ere (couleur moyenne) par un crit`ere de similarit´e surfacique. Le relief de chaque r´egion est mod´elis´e par une surface param´etrique d´efinie par n param`etres (de n = 3 `a n = 15 pour des types de surfaces plus ou moins simples). L’algorithme de la pyramide est inchang´e ; seuls le calcul de ce nouvel attribut (nparam`etres) pour chaque r´egion ainsi que son utilisation comme crit`ere de similarit´e entre r´egions sont diff´erents :

• Le champ r´ecepteur de chaque sommet si, interpr´et´e comme un relief, est approch´e aux moindres carr´es par une surface.

†. range images

chacun de ses voisins : la distance entre si et sj est ´egale `a l’erreur d’approximation qui serait r´ealis´ee si l’union de si et de sj ´etait approch´ee aux moindres carr´es par une surface commune.

Pour un sommet donn´e, l’ensemble de toutes les distances `a ses voisins permet de fixer un seuil local de similarit´e.

Pour plus de pr´ecisions, l’algorithme4donne la fa¸con de construire le graphe de similarit´e correspondant.

L’algorithme 5quant `a lui indique comment est calcul´ee la similarit´e entre deux r´egions voisines.

Algorithme 4 : Construction du graphe de similarit´e par crit`ere d’ajustage de surface (surface fitting)

Entr´ees:

Ga=hS, Ai, le graphe d’adjacence, (S l’ensemble des sommets,Al’ensemble des arˆetesa) T, le seuil global d’erreur

n, l’ordre des surfaces utilis´e Sorties:

Gs=hS, Ei, le graphe de similarit´e, (S l’ensemble des sommets,E l’ensemble des arcsb) E=∅;

/* Calcul de la variance de l’erreur pour chaque sommet */

pour chaquesommet sk∈S faire

Calculer la variance d’erreur entresk et une surface d’ordren; fin

/* Calcul du seuil local pour chaque sommet */

pour chaquesommet sk∈S faire pour chaquevoisin si desk faire

/* appel de l’algorithme 5 */

dik= Distance(si, sk) ; fin

Calculer le seuil localTk `a l’aide desdik; fin

/* Mise en place des arcs du graphe de similarit´e */

pour chaquesommet sk∈S faire pour chaquevoisin si desk faire

sidik< T ETdik< Tk alors

E=E∪arc(sk, si) ; // sk est similaire `a si

fin fin fin

a. Ga est un graphe non orient´e, les liens entre sommets sont bi-directionnels b. Gs est un graphe orient´e, les liens entre sommets son uni-directionnels

2.6. SYNTH `ESE ET COMPRESSION D’IMAGES PAR PYRAMIDE DE SURFACES 31 Algorithme 5: Distance(s1, s2) : Calcul de distance entre 2 r´egions par le crit`ere d’ajustage de surface (surface fitting)

A= matricem×1 des coefficients du mod`ele multipli´es par les coordonn´ees des pixels (cf.

´equation2.1) ;

R´esoudre l’´equation lin´eaire aux moindres-carr´eesAX=B pour trouverX ; Er=AX−B ;

retournervariance(Er);

2.6.3 Synth` ese d’image et compression

Noous d´esirons seulement pr´esenter ici des pistes pour une technique de compression r´eellement orient´ee objets ou tout au moins r´egions. Le traitement est r´ealis´e pour des images couleurs par ap-proche marginale : chaque composante R,V et B est trait´ee ind´ependamment. Une fois la segmentation termin´ee, chaque r´egion est repr´esent´ee par son support spatial et son relief. Le support spatial est sim-plement exprim´e par les coordonn´ees d’un point de d´epart suivies d’une chaˆıne de codes de Freeman qui d´ecrivent le contour. Le relief est donn´e par les coefficients mod´elisant la surface pour chacune des trois composantes couleur. La taille d’une image (exprim´ee en bits) est la somme des tailles des r´egions :

taille(I) =X

taille(Ri) =X

32 +card(contour(Ri))×2 + 3n×32 (2.2)

Les coordonn´ees de d´epart sont cod´ees sur 32 bits (2 entiers de 16 bits). Chaque direction de Freeman n´ecessite 2 bits. Chacun des 3ncoefficients est cod´e par un r´eel sur 32 bits.

Bien entendu, ce codage de base peut ˆetre sensiblement am´elior´e : en fonction de la taille des images, les coordonn´ees de d´epart n´ecessiteront moins de bits. Quant aux contours, un codage arithm´etique peut faire descendre ce nombre entre 1.1 et 1.3 bits par pixel dans le cas d’un codage sans perte et jusqu’`a 0.4

`

a 0.6 bit par pixel avec perte [PL97]. Enfin, il n’est pas n´ecessaire d’utiliser un codage en virgule flottante sur 32 bits pour les coefficients (a00peut ˆetre assimil´e `a un entier sur 8 bits).

Il faut noter que dans les images que nous avons trait´ees, l’approximation avec des plans (n = 2) donne le meilleur compromistemps d’ex´ecution / qualit´e du r´esultat. En effet, la mod´elisation de r´egions d’ordres sup´erieurs ne concerne que des zones de transition dans l’image qui sont peu propices `a donner lieu `a des r´egions.

Les figures2.6.b et2.6.c montrent des partitions obtenues et synth´etis´ees par des couleurs moyennes et par des plans. On peut voir que le rendu est nettement am´elior´e par l’utilisation de plans qui s’in-clinent en suivant les d´egrad´es de l’image. La figure 2.7 compare deux profils couleurs caract´eristiques correspondants. On peut voir dans la figure2.7.b qu’une grande majorit´e des r´egions sont repr´esent´ees par des d´egrad´es importants.

Du fait de sa repr´esentation hi´erarchique / multir´esolution, la pyramide irr´eguli`ere se prˆete bien

`

a la scalabilit´e. En effet, la construction d’une seule pyramide fournit toute une gamme de rapports d´ebit/distorsion (figure 2.8). On remarquera sur ces figures un rapport d´ebit / distorsion assez faible.

Effectivement, la mod´elisation par surface n’est souhaitable que pour des r´egions qui s’y prˆetent (essen-tiellement les d´egrad´es).

(a) Image originale (b) Chaque pixel porte la couleur moyenne de sa r´egion. PSNR=

23.47

(c) Chaque pixel appartient `a une r´egion mod´elis´ee par un plan orient´e. PSNR= 26.02. Noter la douceur des d´egrad´es

Figure2.6 – Comparaison de partitions repr´esent´ees en couleurs moyennes et sous forme de plans orient´es

(a) Exemple de profil de la figure2.6.b (b) Exemple de profil de la figure2.6.c

Figure 2.7 – Comparaison du profil couleur de la diagonale principale pour la pyramide classique et la pyramide surfacique

(a) Image de synth`ese du film cars (b) Photo de Grenoble

Figure2.8 – Chaque courbe d´ebit / distorsion est obtenue `a partir d’une seule pyramide. Chaque point repr´esente un niveau

In document The DART-Europe E-theses Portal (Page 35-39)