Protocoles de routage au sein de r´ eseaux structur´ es

3.5 Couche de routage

3.5.1 Protocoles de routage au sein de r´ eseaux structur´ es

Les protocoles de routages au sein d’un réseau P2P structuré étant un domaine actif de recherche, plusieurs solutions ont été développées et testées avec succès comme l’indique la référence [21]. Aussi ai-je décidé de n’en présenter qu’une sélection dont les mécanismes forment les bases de ce type de protocoles. Dans cette section, les protocoles de routage Chord, CAN et Pastry sont résumés.

CAN

CAN, ou Content Addressable Network [30], est une infrastructure P2P distribuée et décentralisée permettant les fonctionnalité d’une table de hashage distribuée à l’échelle d’Internet. Le design de cette infrastructure est telle qu’elle permet à CAN d’être exten-sible, tolérante aux fautes et auto-adaptative⁷. Son architecture utilise un espace cartésien de dimension d qui est dynamiquement réparti entre les différents noeuds (on suppose un nombre de N peers) de manière à ce que chaque peer possède sa propre portion de l’espace. Ainsi, chaque peer va maintenir une table de routage contenant l’adresse IP des noeuds voisins ainsi que leurs coordonnées associées au sein de l’espace permettant alors

a cette peer de router un message vers un noeud qui est plus proche de la destination.

Pour un espace de dimension d partitionné en n zones, la longueur moyenne d’un chemin lors d’un routage est de ^d₄n¹^d sauts et chaque noeud maintient 2d noeuds voisins. Afin de placer la paire ¡Clé, Valeur¿, une fonction de hashage uniforme est utilisée de fa¸con

a faire correspondre la clé à un point de l’espace. Ensuite, dans le but de retrouver la valeur correspondante à une clé, un noeud va utiliser cette même fonction pour trouver le point P. Si le noeud effectuant la requête ou ses voisins ne détiennent pas le point P dans leur espace, la requête sera alors transférée au travers le réseau CAN jusqu’à ce noeud.

Comme illustré à la figure3.5, un noeud arrivant dans le système doit se voir accorder une portion de l’espace. Pour ce faire, le nouveau noeud se connecte auprès du noeud de bootstrap⁸ qui va lui renseigner de manière aléatoire un certain nombre de peers. Le nouveau noeud choisira alors dans cette liste une peer qui permettra de transférer une requête JOIN vers un point aléatoireP de l’espace. Ce message se verra transférer jusqu’au noeud le plus proche en terme de coordonnées du pointP qui se verra partager son espace

7Self-organizing.

8Noeud de connexion de fran¸cais.

Fig. 3.5 – CAN : ajout du noeud 7 et partage de la zone appartenant `a 1 en deux

propre en deux avec le noeud joignant. Le nouveau noeud pourra alors cr´eer son ensemble de noeuds voisins.

Lorsqu’un noeud quitte le réseau, un noeud voisin le détecte et va récupérer la zone précédemment occupée. Les voisins vont également mettre à jour leur table de routage afin d’éliminer le noeud qui n’est plus actif.

Chord

Chord [41] utilise le “hashing consistent” [18] afin répartir des clés entre les différents peers du système tout en balan¸cant la charge avec une grande probabilité (les noeuds re¸coivent plus ou moins le même nombre de clés). De plus, lors de l’ajout ou du départ du Nê noeud, seulement O(_N¹) des clés se verront déplacées afin de maintenir la répartition de la charge. Dans un système à N peers, chaque noeud maintient des informations de routage pour seulementO(logN) peers.

La fonction de “hashing consistent” assigne à chaque noeud ainsi qu’à chaque clé un identifiant dembits qui sera calculé par hashage sur base de l’adresse IP pour les noeuds et sur base de la clé dans le cas d’une clé. Afin d’éviter au maximum des conflits d’identifiants, la valeur de m se doit d’être suffisamment grande de manière à rendre la probabilité d’un conflit très petite. L’ensemble des identifiants est ordonné sur un cercle modulo 2m qui est

N8's Finger Table

+1 +2 +4 +8 +16 +32

Fig. 3.6 – Chord : “finger table” du noeud N8

identifiant qui suit celui de la clé dans le sens des aiguilles d’une montre. Ce noeud sera appelé le successeur de la clé k et est noté successeur(k). Afin de pr´eserver la répartition de la charge lors de l’arrivée d’un noeud n, certaines cl´es assignées aux successeurs de n doivent être assignée à n. De mˆeme, lors du départ du noeud n, toutes les cl´es assignées

a n doivent être réparties entre les différents successeurs de n. Le nombre de messages nécessaires pour rétablir le cercle lors de l’arrivée ou du départ d’un noeud est de l’ordre deO(log²N).

m étant le nombre de bits de l’espace d’adressage des identifiants, chaque noeud va maintenir jusqu’à mentrées dans une table de routage appelée“finger table”. La iê entrée de la “finger table” du noeudncontient l’identité du premier noeud squi suitn d’au moins 2ⁱ⁻¹. Autrement dit,s=successeur(n+2ⁱ⁻¹). Chaque entrée de cette table contient l’iden-tifiant du noeud concerné ainsi que son adresse IP. Il est important que les informations concernant les successeurs soient à jour. Pour ce faire, Chord exécute périodiquement un algorithme de stabilisation qui va mettre à jour les pointeurs vers les noeuds successeurs dans la “finger table”.

Le mécanisme utilisé par le noeud n lors d’une requête pour trouver le successeur de la cléket donc pour connaˆıtre le noeud stockant cette donnée est le suivant :nva rechercher

dans sa “finger table” le noeud ayant un identifiant plus proche de celui dek que le sien et lui transférer la requête. Chord effectue ainsi le routage avec grande probabilité enO(logN) dans des conditions standard avec un système composé de N noeuds.

Pastry

Pastry [34] utilise, tout comme la couche de routage Tapestry⁹, le mécanisme de routage par préfixe afin de déterminer les routes empruntées lors de l’envoi de messages. Cette méthode, illustrée à la figure 3.7, permet de se rapprocher efficacement de la destination en augmentant, à chaque saut constituant la route, la longueur du préfixe commun à l’identifiant du noeud courant et à celui de la destination.

128

Fig. 3.7 – Pastry : Routage par pr´efixe

Cette couche de routage assigne à chaque noeud ainsi qu’à tout objet un GUID d’une longueur de 128 bits. Ce dernier est calculé pour les noeuds en appliquant une fonction de hashage sécurisée (telle que SHA-1 [11]) sur l’adresse IP du noeud considéré ou encore sur sa clé publique. En ce qui concerne l’identifiant des objets, ce dernier est calculé en

9Tapestry [56] ne sera pas détaillé dans ce mémoire étant donné sa grande similitude de fonctionnement

appliquant également une fonction de hashage sécurisée sur par exemple le nom de l’objet.

Cette assignation d’identifiants permet d’obtenir des GUIDs uniformément distribués sur l’intervalle de [0 ; 2¹²⁸−1], qui seront ordonnés sur un cercle de GUIDs tout comme celui de Chord.

En supposant un réseau composé de N noeuds, Pastry permet de router un message vers le noeud qui est numériquement le plus proche d’une certaine clé en moins dedlog_BNe sauts et ce, sous des conditions standard (B = 2^b est un paramètre de configuration avec une valeur typique pour b de 4). Un GUID est donc considéré ici comme une séquence de chiffres en base B. Lors du routage, une peer va transf´erer un message au noeud ayant un identifiant qui partage avec la clé un préfixe, qui est au moins un chiffre plus long que le préfixe partagé par la clé et le noeud courant. Dans le cas où un tel noeud n’est pas connu, ce message sera transféré à un noeud ayant un identifiant partageant un préfixe avec la clé aussi long que la peer courante mais étant numériquement plus proche de la clé que l’identifiant du noeud courant. Pour ce faire, chaque noeud va maintenir les trois ensembles suivants détaillés par la suite :

– une table de routage, – un leaf set,

– un neighborhood set.

Une table de routage R, illustr´ee à la figure 3.8, est une table composée de log_BN lignes composées chacune deB−1 entrées. LesB−1 entrées se trouvant à lanêligne deR correspondent à des peers ayant leur identifiant (NodeID) qui partage lesnpremiers chiffres de l’identifiant du noeud courant mais qui diffère de ce dernier au chiffre n+ 1. Chaque entrée composant R contient l’adresse IP de la peer se conformant à la règle précitée et est choisie selon une métrique de proximité. Le choix de la valeur de b constitue donc un compromis entre la taille de la table de routage de chaque noeud (égale à (log_BN)(B−1)) et le nombre de sauts nécessaires lors du routage d’un message (égal à log_BN).

Le neighborhood set M est un ensemble constitu´e de couples ¡ NodeId, Adresse IP ¿ de

|M| noeuds proches du noeud local en terme d’une certaine métrique de proximité (telle que le nombre de sauts IP). Cet ensemble n’est pas utilisé lors du routage d’un message mais est fort utile afin de maintenir les propriétés de localité de Pastry.

Le leaf setLest un ensemble de noeuds divis´e en deux parties :|L|/2 noeuds num´eriquement proches ayant leur NodeId plus grand que le noeud courant et|L|/2 noeuds num´eriquement

Préfixes des GUID suivis des nodehandles correspondants n

60 61 62 63 64 65 66 67 68 69 6A 6B 6C 6D 6E 6F

n n n n n n n n n n n n

650 651 652 653 654 655 656 657 658 659

n n n n n n n n n n n n n

65A0 65A1 65A2 65A3 65A4 65A5 65A6 65A7 65A8 65A9 65AA 65AB 65AC 65AD 65AE 65AF 0 1 2 3 4 5 6 7 8 9 A B C D E F

Fig. 3.8 – Pastry : Table de routage du noeud ayant un GUID commen¸cant par 65A1. les n correspondent `a des couples ¡ GUID, Adresse IP ¿ symbolisant des noeuds qui devront ˆ

etre utilis´es lors du routage.

proches ayant leur NodeId plus petit que le noeud courant. Le leaf Set est utilisé lors du routage comme précisé ci-dessous. Les tailles deM et deL sont généralement deB ou 2B.

Le routage d’un message s’effectue en suivant l’algorithme ci-dessous :

1. Tout d’abord, le noeud recevant le message vérifie si la clé se trouve dans l’étendue du leaf set. Si c’est le cas, le message est directement transféré vers le noeud de des-tination, soit le noeud appartenant au leaf set et dont l’identifiant est le plus proche de la clé.

2. Dans le cas contraire, la table de routage devra être utilisée et le message sera transféré au noeud partageant un préfixe avec la clé d’une longueur plus grande d’un chiffre qu’avec le noeud courant. Dans certains cas, il est possible que l’entrée appropriée de la table de routage soit vide ou non-joignable. Dans ce cas, le message est transféré vers un noeud qui partage un préfixe avec la clé aussi long qu’avec le noeud courant mais qui est numériquement plus proche de la destination que ce der-nier.

A moins que |L|/2 noeuds adjacents du leaf set ne souffrent de d´efaillances

simul-dynamique de noeuds pouvant joindre le réseau ou le quitter de manière brutale à n’im-porte quel instant. Afin de joindre le réseau, un noeud X va contacter une peer A proche en terme de localité et lui envoyer un message JOIN ayantX pour destination. Ce message sera alors routé de fa¸con normale entre différents noeuds jusqu’à arriver au noeudZ qui est numériquement le plus proche. L’ensemble des noeuds traversés entreAetZ vont envoyer

a X des parties de tables de routage et de leaf set, de fa¸con `a ce que ce dernier puisse s’initialiser.

Dans le cas d’une défaillance d’un noeudIappartenant au leaf set d’une peerK, celle-ci va contacter un noeud A numériquement proche de I. A va alors envoyer en réponse une copie de son Leaf Set qui sera utilisé par K pour réparer son leaf set. La réparation de la table de routage se fait lors de la consultation de cette dernière durant le routage d’un message.

Communication de groupe

4.1 Introduction

Le multicast, ou diffusion de groupe, est un mode de communication qui est apparu afin de répondre au problème de surcharge d’un réseau engendré par une communication d’une station vers un groupe de stations intéressées. En effet, ce genre de communication nécessitait d’envoyer un même message à chaque membre du groupe de destination, en-gendrant ainsi un flux de données beaucoup plus important qui va encombrer le réseau. Ce type de communication utilise donc le principe de communication unicast qui est illustré

a la figure 4.1. Ainsi, afin d’éviter cette surcharge, la communication multicast permet de n’envoyer qu’un seul message vers un groupe de processus intéressés, l’appartenance au groupe étant généralement transparente pour l’expéditeur du message. Il est à noter que ce type de communication est souvent confondu avec la communication broadcast qui permet d’envoyer un message d’un processus vers tous les processus d’un réseau, tandis que le multicast le permet vers certains processus. Un autre mode de communication possible au sein d’un système distribué est la communication anycast qui permet d’envoyer un message vers un seul membre d’un groupe, généralement le plus performant ou le plus proche.

Les applications utilisant le mode de communication multicast sont nombreuses et couvrent un grand nombre de domaines. Parmi celles-ci, on peut citer les applications sui-vantes :

Emetteur Destination 4

Destination 3

Destination 2 Destination 1

Données envoyées = 4 x taille d’un seul message

Fig. 4.1 – Envoi d’un mˆeme message vers quatre destinations

• le tableau partagé¹ permettant à plusieurs intervenants de modifier simultanément une zone d’écriture ou de dessin, facilitant ainsi par exemple la collaboration d’em-ployés d’une même entreprise se trouvant aux quatre coins du monde,

• les applications de chat,

• les conf´erences Audio/Vid´eo,

• la communication avec un groupe de serveurs,

• la r´eplication de donn´ees,

• les jeux interactifs `a grande ´echelle sur Internet,

• les bases de donn´ees distribu´ees, ...

Après avoir introduit les concepts du IP-multicast, ce chapitre se focalisera sur le mul-ticast de type applicatif implémenté dans un environnement peer-to-peer tout en essayant de mettre en évidence ses avantages par rapport au IP-multicast.

1Shared whiteboards.

Dans le document Web Services : Beyond the peer-to-peer architecture (Page 48-57)