• Aucun résultat trouvé

4 CoReDeM : Simplification géométrique pour les cartes de densité

4.5 Stratégies de compression géométrique

transfert

réseau des symboles(1) décodage

(2) diagramme Voronoï (3) géométrie intersectée rendu conservateur

(A) : compression (B) : décompression

client de visualisation infrastructure distribuée

Figure 4.10: Vue d’ensemble du pipeline de compression géométrique, commun à toutes les stratégies.

approche cohérente retranscrit des portions d’images à l’identique là où la géométrie est aussi

fine que les données. Par exemple, sur la figure4.9, ˜I1,5= I1,5.

4.5 Stratégies de compression géométrique

Comme expliqué précédemment, on s’intéresse à l’utilisation de réduction géométrique (ou

abstractiongéométrique) pour compresser des cartes de densités d’ensembles de points. Ces compressions par simplification géométrique sont des compressions avec pertes, respectant les propriétés conservatrices décrites dans la section précédente, et fonctionnant à partir d’un objectif de taux de compression, c.-à-d. sous une contrainte de budget pour la taille de la géométrie compressée. Cette approche permet de fournir des garanties sur les coûts de stockage et de transfert.

Il a de multiples manières de calculer des abstractions géométriques dans ce contexte. Par exemple, une stratégie cherchant à maximiser le nombre de formes peut utiliser exclusivement des cercles puisque ceux-ci ont l’empreinte de stockage la plus petite. Une stratégie cherchant à minimiser l’aire des formes peut utiliser des polygones englobants dont l’empreinte en stockage est plus forte mais qui entourent plus précisément les groupes de points que les cercles.

4.5.1 Approche générale

Nous nous intéressons à des stratégies formée de deux étapes : une première partitionnant les données, et une seconde dérivant des formes géométriques englobantes pour chaque partie. La

figure4.10résume ce processus : l’étape de compression (A) inclut un partitionnement des points

(A1), la constitution d’une géométrie pondérée à partie de la partition résultante (A2), et enfin l’encodage de la géométrie (A3) utilisant le format décrit dans la section précédente.

En combinant différentes méthodes de partitionnement et différentes représentations par

formes géométriques élémentaires, on obtient de multiples stratégies présentées en figure4.11.

Les stratégies de compression décrites dans la suite de cette section sont des algorithmes prenant en entrée un taux de compression τ. Pour le respecter, la taille de la géométrie ˜G produite doit être majorée par le budget k équivalent τ, tel que :

taille( ˜G) 6 k = 2n(1 – τ). (4.7)

Sachant que les stratégies produisent des formes du même type, la taille de chacune est majorée par une valeur t et le budget k détermine ainsi le nombre m de parties fournit en paramètre à

l’étape de partitionnement : m = ⌊kt⌋. Ainsi, on obtiendra :

taille( ˜G) 6 mt 6j k

t

k

4.5 stratégies de compression géométrique 57 4m 1 + 3m +0 __. cercle englobant (2p + 1)m +2m EP. p-gone englobant 5m +2m

MB. boîte englobante min.

4m +2m

MC. cercle englobant min.

partitionnement k-moyennes, canopées, échantillonnage aléatoire (KC,CC,RS) 1 + m __. polygone du pavage (2p + 1)m +1 EP. p-gone englobant 5m +1

MB. boîte englobante min.

4m +1

MC. cercle englobant min.

binning rectangulaire, hexagonal (RB, HB)

partitionnement géométrie taille( ˜G) pour m formes

géométrie canonique

∗ pour le partitionnement par canopées : cercles de rayons identiques coût additionnel de l’option de rognage Voronoï.

Figure 4.11 – Stratégies composées en associant une méthode de partitionnement à une méthode de géomé-trie avec ou sans le rognage Voronoï. Pour chaque stratégie, taille( ˜G) est exprimée en fonction de m, le nombre de parties formées à l’étape de partitionnement. Pour certaines stratégies, le rognage optionnel utilisant le diagramme de Voronoï induit un coût additionnel.

partitionnement géometrie rognage voronoï

KC k-moyennes MC cercle englobant minimal VC avec

CC canopées MB boîte englobante minimale __ sans

RS échantillonnage aléatoire EP polygone englobant

RB binningrectangulaire __ canonique

HB binninghexagonal

Table 4.4 – Notations utilisées pour décrire les stratégies par leurs composantes. Ces notations suivent le format[partition][géométrie][rognage], où chaque partie est un code à deux lettres.

On utilisera par la suite la notation compacte[partitionnement] [géométrie]

[ro-gnage]détaillée sur le tableau4.4pour dénommer ces stratégies composées par association de technique à différentes étapes.

4.5.2 Partitionnement des points (A1)

Pour la première étape de partitionnement des points, on considère cinq techniques usuelles produisant des ensembles disjoints de points. Chacune de ces méthodes est associée à une

représentation géométrique canonique dont le coût est reporté sur la figure4.11.

Partitionnement binning Les méthodes par binning groupent tous les points apparte-nant à la même cellule d’un pavage régulier de l’espace composée de carrés ou hexagones réguliers. Leur géométrie canonique fait correspondre chaque partie à la région formée par sa cellule. Ces méthodes ont l’avantage d’être compactes à encoder : dans le cas d’un remplissage dense de la grille, seule la taille de la grille et les poids, possiblement nuls, des cellules sont nécessaires. Pour une grille de m cellules, la géométrie est alors de taille 1 + m, où 1 correspond à la taille de la grille.

Partitionnement par k-moyennes et échantillonnage Le partitionnement en k-moyennes (k-means) fonctionne de manière itérative et assigne chaque point au centroïde le plus proche. Les m centroïdes sont initialement choisis aléatoirement parmi les points et ensuite déplacés au barycentre des points qui leur sont assignés à chaque itération. L’affectation lors de l’atteinte de l’équilibre détermine le partitionnement des points. Le partitionnement par échantillonnage sélectionne m représentants aléatoirement et sans considération spatiale, puis affecte à chaque point son représentant le plus proche pour former une partition des points. La représentation géométrique canonique pour ces deux partitionnements est un ensemble de m cercles englobants, centrés sur le centroïde ou représentant de chaque partie et dont le rayon est calculé comme la distance maximale entre ce point et les points de la partie. Cette géométrie a dont une taille de 4m.

Pa r t it i o n n e m e nt pa r c a n o p é e s Le partitionnement par canopées est une version de

l’algorithme de Mccallum et al. [113] adaptée à l’agrégation géométrique par Perrot [131]. Les

points sont parcourus un par un et sélectionné comme représentant s’ils sont plus loin d’une distance d de tous les représentants sélectionnés jusqu’alors. Une seconde passe sur les points leur assigne leur représentant le plus proche ce qui définit un partitionnement des points. La représentation canonique du partitionnement par canopées consiste en des cercles centrés sur les représentants de chaque partie et de rayon égal à la distance d’agrégation d utilisée. Cette géométrie a un coût de 1 + 3m valeurs pour m cercles.

4.5.3 Représentation par formes géométriques pondérée (A2)

En plus de ces représentations géométriques canoniques, on considère trois approches supplé-mentaires pour constituer des formes couvrantes à partir d’une partition des points et rapportons

leur coût sur la figure4.11.

Puisque les cercles ont l’empreinte de stockage la plus faible, la première de ces méthodes

utilise les cercles englobants minimaux (MC) comme forme pour chaque partie. Pour m parties, la

géométrie pondérée coûte 4m avec cette technique. La seconde de ces méthodes utilise les boîtes

englobantes minimales (MB), c.-à-d. des rectangles alignés aux axes, dont l’empreinte en stockage

est de 5 valeurs en incluant leur poids, soit 5m pour m formes. Enfin, la troisième méthode utilise

des p-gones englobants (EP) construits par simplification de l’enveloppe convexe de chaque partie,

jusqu’à ce que les polygones possèdent p côtés ou moins. Les p-gones englobants ont pour objectif de réduire l’aire des formes couvrantes en étant plus ajustés à l’enveloppe de chaque groupe de point que les cercles ou rectangles. Leur coût est de 2p + 1 valeurs par polygone pondéré, ce qui en fait, très largement, la méthode la plus coûteuse (9m pour des quadrilatères quelconques soit plus de deux fois plus coûteux que les boîtes englobantes).

4.5.4 Reconstruction avec rognage par diagramme de Voronoï (B2-3)

MC MB EP __ RB HB KC CC RS Table 4.5: Dispo-nibilité de l’option rognage Voronoï en fonction du partition-nement (ligne) et de la représentation géo-métrique (colonne).

Les cinq méthodes de partitionnement produisent des parties qui possèdent un point centroïde tel que chaque point du groupe est plus proche de ce centroïde que de tous les autres points. Ce centroïde n’est pas nécessairement un point des données ni l’unique point possédant cette propriété. C’est le centre des cellules issues du binning, les centroïdes des k-moyennes, les centres de canopées et les points élus pour l’échantillonnage aléatoire. De part leur propriété, ces points peuvent servir à calculer un diagramme de Voronoï divisant le plan et en conséquence les points

des données, en accord avec la partition établie lors de l’étape de partitionnement (cf. figure4.12c).

Ce partitionnement spatial peut être utilisé pour raffiner les formes géométriques reconstruites du côté client, en les rognant pour ne conserver que l’intersection entre chaque forme et sa cellule du diagramme correspondante.