Structuration de plates-formes de calcul distribu´ees

graphe `a croissance born´ee en “petit-monde navigable”, i.e. un graphe dans lequel l’algorithme glouton trouve entre toute paire de sommets un chemin dont l’esp´erance de la longueur est born´ee par une puissance du logarithme de la taille de la plus petite boule centr´ee `a la source et contenant la destination. Continuant dans cette veine, l’article [33] donne, sous des hypoth`eses comparables, un algorithme d´ecentralis´e, bas´e sur la construction d’arbres hi´erarchiques couvrant l’ensemble du graphe, qui permet de g´en´erer les arˆetes al´eatoires qui transforment le graphe en petit monde navigable. Sans pr´etendre simuler la fa¸con dont se tissent les liens dans un r´eseau social, il s’agit ici de montrer que la connaissance globale du r´eseau n’est pas n´ecessaire `a l’´etablissement d’une distribution “petit-monde”.

Il est naturel de se demander quels sont les graphes qui peuvent ˆetre ainsi transform´es en petits-mondes navigables. Fraigniaud, Lebhar et Lotker [38] donnent une condition n´ecessaire, exprim´ee en termes d’une majoration de la dimension doublante (un espace m´etrique est de dimension doublante k si toute boule peut ˆetre couverte par 2k boules de rayon deux fois moindre ; la notion est proche, mais pas identique `a celle de croissance born´ee). Plus g´en´eralement, si le choix uniforme des liens al´eatoires conduit `a un “diam`etre glouton” probable de O(√n) pour tout graphe `a n sommets, il est sensiblement plus difficile de concevoir des sch´emas universels d’augmentation qui diminuent beaucoup cette borne, le record ´etant d´etenu par Fraigniaud et al. [37] qui obtiennent (`a facteurs logarithmiques pr`es) O(n1/3).

5.1.2 Mod`eles de graphes “sans ´echelle”

Un certain nombre d’auteurs [1,5,21,55,13] ont propos´e des mod`eles pour rendre compte des carac-t´eristiques structurelles des graphes de type “r´eseaux sociaux” et “graphe d’internet”. Souvent, l’accent est mis sur la distribution de degr´es, dont on observe empiriquement qu’elle semble suivre approxima-tivement une loi de puissance (distribution de Pareto) : la proportion des sommets qui sont de degr´e k est approximativement proportionnelle `a k−α, pour une constante α comprise entre 2 et 3. Le plus cit´e de ces mod`eles est un mod`ele `a “attachement pr´ef´erentiel” [5], dans lequel les sommets arrivent un `a un et se choisissent alors un ou plusieurs voisins al´eatoires, chaque lien ´etant vers un sommet choisi avec une probabilit´e proportionnelle `a son degr´e courant. Un certain nombre de variantes ont ´et´e propos´ees et ´etudi´ees [10, 11,9,21,20, 19,56], tendant `a estimer de mani`ere pr´ecise la distribution des degr´es et divers autres param`etres tels que le diam`etre, qui est typiquement logarithmique.

Dans un travail en commun avec Nicole Eggemann et Nicolas Hanusse [30, 31], nous montrons que, pour certains au moins de ces mod`eles, la propri´et´e de distribution des degr´es et le faible diam`etre ne s’accompagne pas d’une propri´et´e de navigabilit´e. Plus pr´ecis´ement, la connaissance du processus de construction du graphe et, pour chaque sommet rencontr´e, de son ordre d’apparition, ne permet pas, en examinant un par un les liens des sommets rencontr´es, de trouver un chemin court (de longueur O(log(n)) ou logO(1)(n)) du sommet 1 (le plus ancien) au sommet n (le plus r´ecent). L’argument est de type th´eorie de l’information : les√n derniers sommets sont difficilement distinguables, et un algorithme qui cherche l’un d’eux a tendance `a les “d´ecouvrir” dans un ordre quasi uniforme.

5.2 Structuration de plates-formes de calcul distribu´ees

Une autre th´ematique de recherche est celle de l’algorithmique pour les plates-formes distribu´ees `a grande ´echelle, th´ematique d´evelopp´ee dans le cadre de l’´equipe-projet INRIA C´epage. L’un des objectifs

est ici de proposer des mod`eles de structuration et des algorithmes aux performances prouv´ees pour des syst`emes de calcul distribu´e collaboratif.

Dans un travail commun avec Olivier Beaumont et Miroslaw Korzeniowski [8], nous d´ecrivons et analysons une m´ethode d’appariement al´eatoire distribu´e de ressources, bas´ee sur l’utilisation de tables

de hachages distribu´ees, et qui fonctionne efficacement mˆeme en pr´esence de fortes h´et´erog´en´eit´es. ´Etant donn´e un ensemble de nœuds, chacun disposant d’une capacit´e sortante et entrante (qui peuvent repr´esen-ter des bandes passantes entrante et sortante, ou des demandes et offres d’une ressource), le probl`eme est d’obtenir, de mani`ere d´ecentralis´ee, un appariement al´eatoire d’un nombre maximum de ces ressources. La solution que nous proposons permet d’obtenir un tel appariement en (en moyenne) O(log2(N )) messages


et requˆetes dans une table de hachage distribu´ee, mais requiert un fonctionnement semi-synchrone sous la forme d’une succession de rondes (sans utiliser de rondes de calcul, il est difficile d’assurer l’uniformit´e de l’appariement obtenu). Une des applications d’un tel dispositif est la diffusion d’une information dans un r´eseau virtuel (de type pair-`a-pair) dans lequel les participants ont des bandes passantes tr`es diff´erentes ; on obtient un processus de diffusion rapide (O(log(n) rondes) et efficace (O(n log(n)) messages), dans lequel les nœuds sont sollicit´es en proportion de leurs capacit´es.

Dans un autre travail, correspondant au d´ebut de th`ese d’Hubert Larchevˆeque [7], nous nous int´e-ressons `a l’auto-organisation d’un ensemble de nœuds en groupes disposant d’une puissance cumul´ee suffisante, et s´epar´ees par des temps de latence (simul´es sous la forme d’un espace m´etrique) inf´erieurs `

a une limite fix´ee. Le probl`eme se ram`ene `a une variante de BinCovering, dans laquelle on ajoute des contraintes de distance. En organisant le syst`eme au moyen d’un skip-graph randomis´e [3, 4], qui constitue la version distribu´ee des skip-lists [63], nous obtenons, lorsque l’espace m´etrique des latences est assimilable `a Rd (avec d petit), un algorithme d´ecentralis´e qui r´ealise une approximation `a un facteur constant de l’optimal, au prix d’une l´eg`ere relaxation des contraintes de distance.

Curriculum vitae

Philippe Duchon

Section CNU 27

N´e le 17 octobre 1969 `a Nancy (54) Nationalit´e Fran¸caise

Fonction Maˆıtre de Conf´erences ENSEIRB

Addresse LaBRI-INRIA Bordeaux - Sud-Ouest Campus Universitaire 351, cours de la lib´eration 33405 Talence cedex


Tel. : (+33) 5 4000 6912 m`el : Philippe.Duchon@labri.fr


2006-2008 D´el´egation CNRS (18 mois)

1999- Maˆıtre de conf´erences`a l’ENSEIRB 1998-1999 ATER`a l’universit´e Bordeaux 1

6 juin 1998 Doctorat(Informatique) de l’universit´e Bordeaux 1 Titre :Q-grammaires : un outil pour l’´enum´eration

Jury : Philippe FLAJOLET (pr´esident), Jean-Marc F´EDOU (rapporteur), Renzo PINZANI (rapporteur), Mireille BOUSQUET-M´ELOU (examinatrice), Daniel KROB (examinateur), Maylis DELEST (directrice de th`ese).

1996-1998 Allocataire moniteur normalien`a l’universit´e Bordeaux 1 1993-1994 Allocataire moniteur normalien`a l’universit´e Bordeaux 1 1992 Agr´egation de math´ematiques

1989-1993 El`´ eve `a l’ ´Ecole Normale Sup´erieure(Paris)

B.1 Responsabilit´es et activit´es collectives

