a un affichage), le r´esultat pour unσM donn´e est obtenu en temps r´eel ; un utilisateur peut ainsi `a l’aide d’une souris modifier la valeur d’un curseurσM plusieurs fois par seconde et voir les d´etails apparaˆıtre ou disparaˆıtre, mˆeme pour des images de grande taille. Les figures2.4et2.5comparent les premiers niveaux d’une pyramide avec des r´esultats de la pyramide multir´esolution obtenus pour plusieurs valeurs de σM. L’application graphique qui impl´emente l’algorithme de la pyramide irr´eguli`ere et celui de la pyramide multir´esolution peut ˆetre t´el´echarg´ee `a l’adresse suivante :
http ://www.gipsa-lab.inpg.fr/∼pascal.bertolino/software/waips.exe
Algorithme 3: Proc´edure r´ecursive Diviser(sommet, niveau) Donn´ees: unsommetappartenant `a unniveau
pourchaque filsf dusommetfaire siσ(f)> σM alors
Diviser(f, niveau−1) ; sinon
pourchaque pixelpdontf est le sommet r´ecepteur faire sommet r´ecepteur final(p) =f ;
fin fin fin
(a) Image originale (b) Niveau 1 (c) Niveau 2 (d) Niveau 3
Figure2.4 – Les premiers niveaux d’une pyramide classique
2.6 Synth` ese et compression d’images par pyramide de surfaces
Dans cette section, je pr´esente le travail de master de Tien Sy Nguyen qui montre que la pyramide irr´eguli`ere est un ou-til flexible et versaou-tile. Dans cette recherche, nous d´esirons am´eliorer la fa¸con dont les r´egions sont mod´elis´ees et ´egalement envisager d’autres finalit´es que la segmentation.
2.6.1 Ajustage de surface et mod´ elisation param´ etrique
Dans sa version initiale, la pyramide mod´elise le contenu de chaque r´egion par une couleur moyenne et un ´ecart-type. Bien que pratique et justifiable, cette mod´elisation classique, utilis´ee comme crit`ere de
2.6. SYNTH `ESE ET COMPRESSION D’IMAGES PAR PYRAMIDE DE SURFACES 29
(a)σM = 12 (b)σM = 15 (c)σM = 20 (d)σM = 29
Figure2.5 – Quelques r´esultats d’une pyramide multir´esolution
fusion poss`ede des limites pour repr´esenter des r´egions de type d´egrad´e ou textur´e. Ici, nous nous sommes int´eress´es aux r´egions d´egrad´ees en nous inspirant des travaux de Besl et Jain [BJ88] qui segmentent des images de profondeur† en consid´erant l’image monochrome comme un relief. Le contenu de chaque r´egion est ainsi mod´elis´e par une surface d’ordre 1, 2, 3 ou 4 qui peut repr´esenter un plan, une surface minimale, un sommet, un puits, une crˆete, une vall´ee, une selle crˆete ou une selle vall´ee. Les auteurs utilisent des polynˆomes bi-vari´es repr´esentant une surface `a l’aide de 3 `a 15 param`etres en fonction de la complexit´e du relief de la r´egion (´equation2.1).
f(n, ~a;x, y) =a00+a10x+a01y+a11xy+a20x2+a02y2+a21x2y+a12xy2+a30x3
+a03y3+a31x3y+a22x2y2+a13xy3+a40x4+a04y4 (2.1) nest l’ordre du mod`ele (1, 2, 3 ou 4) auquel correspond un vecteur de param`etres~a: 3 param`etres d´efinissent une surface plane, 6 param`etres une surface bi-quadrique, 10 param`etres une surface bi-cubique et 15 param`etres une surface bi-quartique.
Dans leur algorithme, un ´etiquetage des pixels de l’image est r´ealis´e selon le signe de courbure de la surface locale. Il fournit une partition grossi`ere qui est ensuite ´erod´ee pour donner des germes utilis´es dans une croissance de r´egion bas´ee sur la mise en correspondance de surfaces d’ordre appropri´e. Il est `a noter que le r´esultat final n’est pas une segmentation en tant que telle puisqu’il y subsiste g´en´eralement un nombre plus ou moins important de pixels non ´etiquet´es (trous).
En s’inspirant de ce mod`ele, nous d´esirons d’une part approcher au mieux le relief des r´egions mais
´
egalement utiliser le mod`ele dans la pyramide irr´eguli`ere comme crit`ere de fusion. Nous donnons ici les pr´emisses de ce travail qui nous paraˆıt tr`es prometteur. Notre but est triple :
• utiliser un crit`ere de segmentation de plus haut niveau
• synth´etiser l’image originale `a partir d’une de ses segmentations
• proposer une nouvelle technique pour la compression d’image
2.6.2 Crit` ere de similarit´ e surfacique
Dans cette partie, nous rempla¸cons le crit`ere de similarit´e classique de la pyramide irr´eguli`ere (couleur moyenne) par un crit`ere de similarit´e surfacique. Le relief de chaque r´egion est mod´elis´e par une surface param´etrique d´efinie par n param`etres (de n = 3 `a n = 15 pour des types de surfaces plus ou moins simples). L’algorithme de la pyramide est inchang´e ; seuls le calcul de ce nouvel attribut (nparam`etres) pour chaque r´egion ainsi que son utilisation comme crit`ere de similarit´e entre r´egions sont diff´erents :
• Le champ r´ecepteur de chaque sommet si, interpr´et´e comme un relief, est approch´e aux moindres carr´es par une surface.
†. range images
chacun de ses voisins : la distance entre si et sj est ´egale `a l’erreur d’approximation qui serait r´ealis´ee si l’union de si et de sj ´etait approch´ee aux moindres carr´es par une surface commune.
Pour un sommet donn´e, l’ensemble de toutes les distances `a ses voisins permet de fixer un seuil local de similarit´e.
Pour plus de pr´ecisions, l’algorithme4donne la fa¸con de construire le graphe de similarit´e correspondant.
L’algorithme 5quant `a lui indique comment est calcul´ee la similarit´e entre deux r´egions voisines.
Algorithme 4 : Construction du graphe de similarit´e par crit`ere d’ajustage de surface (surface fitting)
Entr´ees:
Ga=hS, Ai, le graphe d’adjacence, (S l’ensemble des sommets,Al’ensemble des arˆetesa) T, le seuil global d’erreur
n, l’ordre des surfaces utilis´e Sorties:
Gs=hS, Ei, le graphe de similarit´e, (S l’ensemble des sommets,E l’ensemble des arcsb) E=∅;
/* Calcul de la variance de l’erreur pour chaque sommet */
pour chaquesommet sk∈S faire
Calculer la variance d’erreur entresk et une surface d’ordren; fin
/* Calcul du seuil local pour chaque sommet */
pour chaquesommet sk∈S faire pour chaquevoisin si desk faire
/* appel de l’algorithme 5 */
dik= Distance(si, sk) ; fin
Calculer le seuil localTk `a l’aide desdik; fin
/* Mise en place des arcs du graphe de similarit´e */
pour chaquesommet sk∈S faire pour chaquevoisin si desk faire
sidik< T ETdik< Tk alors
E=E∪arc(sk, si) ; // sk est similaire `a si
fin fin fin
a. Ga est un graphe non orient´e, les liens entre sommets sont bi-directionnels b. Gs est un graphe orient´e, les liens entre sommets son uni-directionnels
2.6. SYNTH `ESE ET COMPRESSION D’IMAGES PAR PYRAMIDE DE SURFACES 31 Algorithme 5: Distance(s1, s2) : Calcul de distance entre 2 r´egions par le crit`ere d’ajustage de surface (surface fitting)
A= matricem×1 des coefficients du mod`ele multipli´es par les coordonn´ees des pixels (cf.
´equation2.1) ;
R´esoudre l’´equation lin´eaire aux moindres-carr´eesAX=B pour trouverX ; Er=AX−B ;
retournervariance(Er);
2.6.3 Synth` ese d’image et compression
Noous d´esirons seulement pr´esenter ici des pistes pour une technique de compression r´eellement orient´ee objets ou tout au moins r´egions. Le traitement est r´ealis´e pour des images couleurs par ap-proche marginale : chaque composante R,V et B est trait´ee ind´ependamment. Une fois la segmentation termin´ee, chaque r´egion est repr´esent´ee par son support spatial et son relief. Le support spatial est sim-plement exprim´e par les coordonn´ees d’un point de d´epart suivies d’une chaˆıne de codes de Freeman qui d´ecrivent le contour. Le relief est donn´e par les coefficients mod´elisant la surface pour chacune des trois composantes couleur. La taille d’une image (exprim´ee en bits) est la somme des tailles des r´egions :
taille(I) =X
taille(Ri) =X
32 +card(contour(Ri))×2 + 3n×32 (2.2)
Les coordonn´ees de d´epart sont cod´ees sur 32 bits (2 entiers de 16 bits). Chaque direction de Freeman n´ecessite 2 bits. Chacun des 3ncoefficients est cod´e par un r´eel sur 32 bits.
Bien entendu, ce codage de base peut ˆetre sensiblement am´elior´e : en fonction de la taille des images, les coordonn´ees de d´epart n´ecessiteront moins de bits. Quant aux contours, un codage arithm´etique peut faire descendre ce nombre entre 1.1 et 1.3 bits par pixel dans le cas d’un codage sans perte et jusqu’`a 0.4
`
a 0.6 bit par pixel avec perte [PL97]. Enfin, il n’est pas n´ecessaire d’utiliser un codage en virgule flottante sur 32 bits pour les coefficients (a00peut ˆetre assimil´e `a un entier sur 8 bits).
Il faut noter que dans les images que nous avons trait´ees, l’approximation avec des plans (n = 2) donne le meilleur compromistemps d’ex´ecution / qualit´e du r´esultat. En effet, la mod´elisation de r´egions d’ordres sup´erieurs ne concerne que des zones de transition dans l’image qui sont peu propices `a donner lieu `a des r´egions.
Les figures2.6.b et2.6.c montrent des partitions obtenues et synth´etis´ees par des couleurs moyennes et par des plans. On peut voir que le rendu est nettement am´elior´e par l’utilisation de plans qui s’in-clinent en suivant les d´egrad´es de l’image. La figure 2.7 compare deux profils couleurs caract´eristiques correspondants. On peut voir dans la figure2.7.b qu’une grande majorit´e des r´egions sont repr´esent´ees par des d´egrad´es importants.
Du fait de sa repr´esentation hi´erarchique / multir´esolution, la pyramide irr´eguli`ere se prˆete bien
`
a la scalabilit´e. En effet, la construction d’une seule pyramide fournit toute une gamme de rapports d´ebit/distorsion (figure 2.8). On remarquera sur ces figures un rapport d´ebit / distorsion assez faible.
Effectivement, la mod´elisation par surface n’est souhaitable que pour des r´egions qui s’y prˆetent (essen-tiellement les d´egrad´es).
(a) Image originale (b) Chaque pixel porte la couleur moyenne de sa r´egion. PSNR=
23.47
(c) Chaque pixel appartient `a une r´egion mod´elis´ee par un plan orient´e. PSNR= 26.02. Noter la douceur des d´egrad´es
Figure2.6 – Comparaison de partitions repr´esent´ees en couleurs moyennes et sous forme de plans orient´es
(a) Exemple de profil de la figure2.6.b (b) Exemple de profil de la figure2.6.c
Figure 2.7 – Comparaison du profil couleur de la diagonale principale pour la pyramide classique et la pyramide surfacique
(a) Image de synth`ese du film cars (b) Photo de Grenoble
Figure2.8 – Chaque courbe d´ebit / distorsion est obtenue `a partir d’une seule pyramide. Chaque point repr´esente un niveau