Structures compactes : graphes et petits s´eparateurs

Une stratégie tout à fait différente a inspiré les travaux de Blanford et al. [13, 11, 12, 14], qui ont proposé des représentations compactes pour certaines classes de graphes et maillages, pouvant gérer des opérations de navigation locale de manière efficace8_{. L’efficacité de leur approche repose}

sur les propriétés des graphes séparables (récemment décrites dans [92, 91]) : intuitivement un graphe est séparable si tous ses sous-graphes peuvent être partitionnés en deux parties ayant environ la même taille, juste en sup- primant un nombre relativement limité de sommets9_{. Plus précisément, un}

graphe G ayant n sommets est séparable (o`u avec petits séparateurs) s’il existe un ensemble de O(nc) sommets (appelé coupe) dont la suppression déconnecte G en deux sous-graphes (appartenant à la même classe que G) ayant chacun au plus αn sommets (avec α < 1, c < 1).

Le principe fondamental consiste à adopter une représentation explicite des relations d’adjacence des sommets du graphe, utilisant des pointeurs locaux de ”petite taille” : les sommets sont d’abord étiquetés à l’aide des séparateurs de graphes, et leurs voisins sont représentés par un entier, de ”petite” taille, codant la différence du sommet original. Le point crucial est que pour certaines classes de graphes (séparables), il existe une manière d’étiqueter les sommets telle que deux sommets adjacents auront des in- dex assez proches. Cette remarque, et une méthode efficace de codage par différences, permet d’établir le résultat suivant [13] :

Lemme 36. Soit G un graphe `a n sommets ayant des petits s´eparateurs,

et pour lequel chaque arête (v₁, v₂) peut se coder avec O(lg |v₁ − v₂|) bits. Alors l’espace utilisé pour coder toutes les arêtes est au plus O(n) bits et les requêtes d’adjacence entre sommets peuvent s’effectuer en temps O(1).

Dans ce cadre, ils s’avère que certaines classes de graphes sont spé- cialement intéressantes : par exemple, les graphes planaires admettent des séparateurs de taille O(n1/2_{) [88] et certains maillages bien formés en R}d

ont des s´eparateurs de taille O(n1−1d) [91]. Il r´esulte alors que les maillages

planaires, les maillages 3D volumiques bien formés, ainsi que les maillages surfaciques de genre borné satisfont les hypothèses du lemme 36 et admettent donc des représentations compactes de taille linéaire.

8_{En ce qui concerne le modèle de calcul, ces travaux adoptent le même modèle de}

machine word-RAM utilis´e dans cette th`ese

Repr´esentations succinctes

de graphes

Repr´esentations succinctes :

schéma général

Le but de ce chapitre est de présenter une formulation plus générale et précise du paradigme algorithmique sousjacent aux représentations compactes et succinctes mentionnées précédemment. En particulier nous nous proposons de fournir un schéma général1 _{qui puisse unifier à la fois les}

représentations existantes (mots de parenthèses, arbres, graphes planaires) et les nouvelles représentations succinctes de maillages faisant l’objet prin- cipal de cette thèse (triangulations et cartes planaires, décrites aux chapitres 5-7).

4.1 Introduction

Comme il a été plusieurs fois déjà remarqué, la plupart des structures de données sont basées sur des représentations explicites par pointeurs.

Par exemple, cela arrive dans le cas des arbres binaires, d’habitude im- plantés en utilisant, pour chaque nœud, un pointeur vers son fils gauche et son fils droit : si d’une part cette implantation permet un accès efficace à l’information stockée dans l’objet, d’autre part l’utilisation de O(m) poin- teurs chacun sur O(lg m) bits, oblige à utiliser au moins Ω(m lg m) bits pour représenter un arbre ayant m nœuds.

Or, du point de vue de la th´eorie de l’information, 2m bits devraient suffire, puisque il existe moins de 4m arbres binaires de taille m.

Cette remarque a conduit, ´etant donn´e une classe Cm d’objets de taille

m, au probl`eme de concevoir, si possible, une repr´esentation succincte de

ces objets, c’est-`a-dire une structure de donn´ees telle que :

– le coˆut du stockage de la repr´esentation R d’un objet dans Cm corres-

pond asymptotiquement (au premier ordre) `a l’entropie de la classe,

1_{Une version préliminaire des résultats de ce chapitre, a été publiéà SoCG 2006[28].}

ce qui s’exprime par (lorsque m tend `a l’infini) taille(R) = lg |Cm| · (1 + o(1))

– la représentation permet de répondre à certaines types de requêtes locales sur l’objet en temps O(1) (pire cas),

– la repr´esentation permet la modification des objets en temps poly- logarithmique amorti par op´eration.

La deuxième propriété assure que la représentation peut être considérée comme une structure de donnée pour les objets de Cm.

La première propriété en fait un codage succinct : parfois, ne pouvant pas atteindre l’optimalité, il est commun de se contenter d’une version plus faible de compacité de la forme

taille(R) = O(lg |Cm|)

La dernière propriété décrit enfin l’aspect dynamique de la représentation. Il existe aussi une autre catégorie de structures de données, appelées

implicites, qui ne stockent que les données à traiter, arrangés dans un certain

ordre pr´e´etabli dont la taille est de la forme taille(R) = lg |C_m| + O(1)

Bien qu’elles ne nécessitent pas de stocker de l’information auxiliaire, ces structures de données suscitent moins d’attention : la difficulté de traiter efficacement des requêtes locales, la classe restreinte d’objets auxquels elles s’appliquent et surtout l’impossibilité de maintenir l’ordre sur les données (et donc la structure) après mise à jour sont parmi les raisons qui rendent les structure de données implicites moins intéressantes, au moins dans le cadre algorithmique adopté dans cette thèse.

4.1.1 Schéma général : esquisse

Le schéma général que nous allons adopter afin de concevoir et décrire une structure de données compacte ou succincte pour une classe d’objets de taille n est esquissé ci-dessous et sera mieux précisé dans la section 4.2 :

– D’abord l’objet est décomposé en sous morceaux de taille Θ(lg n), ap- pelés micro morceaux, de telle manière qu’ils soient assez petits pour que le catalogue de tous les différents micro morceaux possibles puisse se construire en temps o(n) en utilisant au plus o(n) bits. Un tel mi- cro morceau est représenté par une référence dans le catalogue, et la somme des tailles de toutes ces références décrivant l’objet initial va co¨ıncider avec l’entropie de la classe.

– Les relations d’incidences qui décrivent la fa¸con dont le découpage en micro morceaux a été effectué sont représentées par un graphe G

des micro morceaux. Si on suppose qu’il existe O( n

lg n) micro mor-

ceaux avec un nombre sous linéaire de relations d’incidences entre eux (ce qui est le cas, si le graphe G est par exemple planaire), alors le graphe admet une représentation explicite classique de coˆut O(n) uti- lisant des pointeurs de taille logarithmique, ce qui fournit déjà une représentation compacte de l’objet.

– ensuite des mini morceaux de taille O(lg2n) sont construits en re-

groupant Θ(lg n) micro morceaux, ce qui permet d’utiliser des poin- teurs de taille O(lg n) uniquement entre mini morceaux, tandis que les relations de voisinage entre micro morceaux, appartenant au mˆeme mini morceau, peuvent se d´ecrire avec des pointeurs locaux de taille

O(lg lg n). Puisque les mini et micro morceaux sont en nombre res-

pectivement de O(_lgn2_n) et O(_{lg n}n ), cette approche `a plusieurs niveaux

comporte des coˆuts sous-lin´eaires, respectivement de O(_lgn2_nlg n) bits

et O(_{lg n}n lg lg n) bits, pour la représentations des relations d’adjacence décrites par le graphe G, ce qui rend la structure de données succincte.

4.1.2 Repr´esentations succinctes : rappels

Mots de parenthèses et arbres. D’un point de vue général ce paradigme algorithmique a été introduit pour représenter de manière compacte des mots de parenthèses équilibrées par Jacobson [74], et les améliorations de Munro et Raman [96] ont conduit à une représentation succincte (voir section 3.5). Le paramètre de taille d’un mot de parenthèse est son nombre de caractères et l’optimalité correspond à 1 bit par caractère. Dans ce contexte une requête naturelle consiste à retrouver, étant donnée une parenthèse ou- vrante à une certaine position, la parenthèse fermante correspondante. En exploitant une célèbre bijection entre mots de parenthèses et arbres planaires (ou ordonnés), il est donc naturel d’obtenir une représentation succincte de cette dernière classe d’objets qui ne nécessite que 2n bits.

Graphes planaires. Une fois remarqué qu’une carte planaire peut se dé- composer en plusieurs arbres recouvrants, il est naturel d’appliquer à ces derniers le paradigme con¸cu pour les arbres. Il est néanmoins à observer qu’une telle transformation des graphes aux arbres, n’étant pas en générale bijective, conduit à des représentations qui ne sont que compactes et non succinctes. Suivant cette approche une première représentation compacte pour les graphes planaires utilisant 2e + 8n bits a été donnée dans [96] et améliorée dans [31, 29](2e + 2n bits).

Séparateurs Il est à rappeler qu’une stratégie de codage compact de graphes et d’autres structures a été proposée par Blandford et al. [13] uti- lisant une approche totalement différente : bien que l’idée sous-jacente soit

similaire, à savoir l’utilisation de pointeurs locaux de ”petite taille”, l’approche à l’aide des petits séparateurs est totalement différente et ne peut pas rentrer dans le schéma général que nous allons décrire. De plus, cette stratégie nécessite des algorithmes efficaces pour le calcul de séparateurs et la complexité de la représentation n’est pas facile à caractériser, vue la difficulté de fournir explicitement des bornes sur le coût mémoire total.

4.1.3 Notre contribution

Dans nos travaux [27, 26] nous avons montré pour la première fois com- ment étendre le paradigme mentionné auparavant pour qu’il puisse s’appliquer directement aux triangulations et aux cartes planaires plus généralement (sans donc passer par la représentation des arbres ou des mots de pa- renthèses), obtenant ainsi des représentations succinctes pour ces classes d’objets. Cette approche s’est révélée utile aussi pour gérer des mises à jour locales et traiter le cas de triangulations de genre supérieur borné [26].

Du point de vue méthodologique nous allons formaliser le schéma générale qui est commun aux représentations succinctes de cartes planaires illustrées dans les chapitres 5-7.

Par rapport au cadre utilisé dans les premiers travaux concernant le codage des mots de parenthèses et des arbres [74, 96], et aussi dans notre premier travail concernant les triangulations, le schéma présenté dans ce chapitre cherche à rendre explicite le rôle fondamental joué par la propriété de planarité locale des objets à représenter (sans cette propriété il serait impossible de tirer profit de la structure à plusieurs niveaux à la base du schéma).

De plus, nous relâchons la condition, centrale dans tous les travaux pré- cédents, que les micro morceaux doivent appartenir à une classe ayant la même entropie que la classe d’objets à représenter. Cette dernière propriété, couplée à des nouvelles techniques de décomposition spécialement con¸cues pour les triangulations et les cartes 3-connexes planaires, nous permettra par exemple de décrire les premières représentations succinctes optimales pour ces classes d’objets (voir chapitre 7).

Dans le document Représentations compactes de structures de données géométriques (Page 78-85)