3.1-LES ASSERTIONS - LES ACTES DE LANGAGE DANS NGUM A JEMEA OU LA FOI DAVID MBANGA EYOMBWAN. Ma

guidade das parti¸cões de H detidas pelos nós da DHT e fazer com que a sua composi¸cão pare¸ca aleatória. Esta caracter´ıstica separa claramente os nossos modelos de particionamento dos baseados em Hashing Consistente (que garante parti¸cões cont´ıguas) e influencia decisivamente a forma como se constrói o grafo de localiza¸cão distribu´ıda (ver seçcão 4.4.2). Note-se ainda que, à semelhan¸ca de um posicionamento inicial rotativo, um posicionamento que tende a ser aleatório continua a ser adequado a distribui¸cões não-uniformes de registos.

4.4 Especificidades da Localiza¸c˜ao Distribu´ıda

4.4.1 Adequabilidade a Ambientes Cluster

Em ambiente cluster, o número de nós dispon´ıveis para instanciar uma DHT é inferior, em várias ordens de grandeza, ao número de nós que, tipicamente, participam num sistema P2P (dezenas/centenas contra milhares/milhões). Desde logo, essa diferen¸ca de escala sugere que a informa¸cão de posicionamento de uma DHT instanciada em cluster deverá ser suficientemente pequena (da ordem dos Kbytes ou Mbytes) para que a sua totalidade seja comportável por qualquer nó. Este argumento favorece a utiliza¸cão de localiza¸cão baseada num registo centralizado da informa¸cão de localiza¸cão (ou até mesmo com replica¸cão total – rever seçcão 2.4.1.5). Outro argumento que vem ao encontro do anterior é o facto de, em ambiente cluster, o conjunto de nós que suportam uma DHT ter composi¸cão mais estável. Todavia, se admitirmos 1) a possibilidade de se instanciarem múltiplas DHTs no cluster, em simultâneo e 2) de estas estarem sujeitas a um mecanismo de balanceamento dinâmico7, então a aplica¸cão de mecanismos de localiza¸cão distribu´ıda faz sentido. No primeiro caso, interessa balancear a carga de armazenamento da maior quantidade de informa¸cão de localiza¸cão, das várias DHTs. No segundo caso, a redistribui¸cão de uma ou mais DHTs8 acarreta a necessidade de actualizar a sua informa¸cão de localiza¸cão; essa actualiza¸cão pode ser mais ou menos abrangente, dependendo da percentagem redistribu´ıda; com a informa¸cão de localiza¸cão distribu´ıda, o esfor¸co de actualiza¸cão é distribu´ıdo por vários nós, e o número de nós envolvidos na actualiza¸cão será fun¸cão da dimensão da redistribui¸cão.

4.4.2 Necessidade de Grafos Completos em H

Quando o particionamento de H origina parti¸cões cont´ıguas (intervalos), é suficiente construir um grafo GN _{(ou G}V_{) para localiza¸c˜}_{ao distribu´ıda, tomando como vértices os nós}

computacionais (ou virtuais) da DHT. Por exemplo, no Chord [SMK+01], cada nó tem correspondência com um hash em H = {0, 1, ..., 2L− 1) (com fun¸cão de hash de L bits), pelo que apenas um certo número de hashes, inferior a H = 2L, é usado para construir o grafo; este grafo é pois “esparso no dom´ınio dos hashes” e “completo no dom´ınio dos nós”. Ora, como referido na seçcão 4.3, a aplica¸cão dos nossos modelos de distribui¸cão e po-

Pressupostos que, entre outros, est˜ao na base da arquitectura Domus, discutida no cap´ıtulo 5.

A redistribui¸cão traduz-se na transferência de entradas entre um ou mais nós, podendo envolver apenas os nós actuais da DHT, ou nós que abandonam/ingressam a/na DHT.

4.4 Especificidades da Localiza¸c˜ao Distribu´ıda 71

sicionamento resulta em parti¸cões descont´ıguas (com hashes dispersos). Essa particulari- dade impõe a constru¸cão de grafos GH, completos no dom´ınio dos hashes; ou seja, sendo H = {0, 1, ..., 2L−1), um grafo GH terá H = 2Lvértices, correspondentes a todos os hashes de H. O grafo GH _ser´_{a particionado, de forma impl´ıcita, através dos nós da DHT: cada}

nó será responsável pelos vértices correspondentes aos hashes da(s) sua(s) parti¸cão(ões). A necessidade de um grafo GH em vez de GN (ou GV) parece ser uma menos valia importante dos nossos modelos, dado que GH assenta num maior número (o máximo poss´ıvel) de vértices. Veremos, no entanto, que é poss´ıvel desenvolver algoritmos de encaminhamento acelerado, que permitem que a localiza¸cão distribu´ıda em GH _{tenha um custo semelhante}

(e até inferior) ao custo em GN. Além disso, comparando o custo da localiza¸cão em GH com o custo num grafo GV (em que os vértices são nós virtuais, como acontece no Chord9), constata-se que as diferen¸cas no esfor¸co de localiza¸cão podem ser marginais (ver a seguir).

Figura 4.1: a) Número de Vértices e b) Distância Média, p/ várias classes de grafos Chord. A figura 4.1.a) representa o número de vértices de grafos Chord de diferentes classes, em fun¸cão do número de nós N de uma DHT: 1) para a classe GN_{, os vértices correspondem}

a nós computacionais; 2) para as classes GV(HC) e GH(HC), os vértices correspondem aos nós virtuais e às entradas, respectivamente, de uma DHT em que o total de nós virtuais, V(HC), e de entradas, H(HC), é gerado de acordo com o procedimento descrito na avalia¸cão do Hashing Consistente (HC) da seçcão 3.8 (com parâmetro k = 1); 3) para a classe GH(M 2), os vértices correspondem às entradas de uma DHT em que H é gerado pela fórmula 3.11 do modelo M2 de distribui¸cão homogénea (com parâmetro Hmin(n) = 810).

A relativa proximidade do n´umero de v´ertices dos grafos GV_{(HC) e G}H_{(HC), deixa}

adivinhar que a navega¸cão nesses grafos terá um custo semelhante. Esse custo é dado

9_{Sendo baseado em Hashing Consistente, cada n´}_{o virtual ´e associado a uma parti¸c˜}_{ao cont´ınua. A}

compara¸cão com o Chord é importante, pois é gra¸cas à utiliza¸cão de múltiplos nós virtuais por cada nó computacional que o Chord assegura distribui¸cões balanceadas, sejam homogéneas, sejam heterogéneas.

A escolha de k = 1 e Hmin(n) = 8 assegura que o valor de H ´e semelhante sob HC e M2, o que acaba

por favorecer o HC na compara¸c˜ao; de facto, valores Hmin(n) inferiores s˜ao suficientes para garantir a M2

uma qualidade da distribui¸cão superior à do HC (como se demonstrou na avalia¸cão da seçcão 3.8); como valores inferiores de Hmin(n) se traduzem em valores inferiores de H(M 2) então, sob o modelo M2, o grafo

72 4.4 Especificidades da Localiza¸c˜ao Distribu´ıda

pela distância média11_{, d, representada na figura 4.1.b). A evolu¸cão logar´ıtmica de d}

torna menos vincadas as diferen¸cas entre os grafos, em especial entre GV(HC) e GH(HC).

4.4.3 Conceito de Encaminhamento Acelerado

Realizada segundo o algoritmo base de navega¸cão do grafo GH, a localiza¸cão distribu´ıda (ou, equivalentemente, o mecanismo de encaminhamento que a suporta) é convencional, no sentido de que progride entrada-a-entrada e pode resultar na visita repetida de um mesmo nó da DHT. Alternativamente, a análise conjunta das várias tabelas de encaminhamento detidas por cada nó da DHT suporta um encaminhamento acelerado; neste, tenta-se progredir nó-a-nó e evitar visitas repetidas do mesmo nó, ao mesmo tempo que se procuram encontrar e explorar eventuais atalhos topológicos; o saldo final será uma redu¸cão do esfor¸co de localiza¸cão em GH, face ao obtido com encaminhamento convencional. O encaminhamento acelerado procura assim compensar o facto de, na sequência dos nossos modelos de particionamento (que originam parti¸cões descont´ınuas de H), a localiza- ¸cão distribu´ıda assentar num grafo GH, em vez de num grafo GN. Em termos formais, o objectivo é o de aproximar a distância média em GH, à distância média em GN. Preci- samente, a figura 4.1.b) contextualiza este racioc´ınio, para a utiliza¸cão de grafos Chord. O encaminhamento acelerado deverá pois reduzir a distância média d(GH_{) pelo menos até}

ao valor d(GN) e, se poss´ıvel, abaixo dele, fazendo uma utiliza¸cão inteligente do conjunto de informa¸cão de localiza¸cão dispersa pela várias tabelas de encaminhamento de cada nó.

4.4.4 Tabelas de Encaminhamento

A navegabilidade no grafo GH (da qual depende, em última instância, o mecanismo de localiza¸cão distribu´ıda) requer a manuten¸cão, por cada hash h de H, de uma tabela de encaminhamento, T E(h). Genericamente, se qualquer hash h ∈ H tiver K sucessores no grafo, então T E(h) guardará 1) a identidade dos K sucessores (suc(h, k), com k = 0, 1, ..., K − 1) e 2) para cada sucessor, a identifica¸cão12 _{do seu n´}_{o hospedeiro (n(suc(h, k))). Um nó n}

responsável por uma parti¸cão H(n), alojará H(n) = #H(n) tabelas de encaminhamento.

4.4.5 Arvores de Encaminhamento´

Para realizar encaminhamento acelerado de forma eficiente, todas as tabelas de encaminhamento de cada nó de uma DHT são concentradas numa estrutura de dados local. Ge- nericamente, designamos essa estrutura por árvore de encaminhamento. Tendo em conta o seu propósito, uma árvore de encaminhamento deve satisfazer um conjunto de proprieda- des relevantes: 1) suportar a adi¸cão/remo¸cão eficiente de tabelas de encaminhamento, 2) assegurar acesso eficiente a tabelas individuais (no máximo, acesso de ordem logar´ıtmica, face ao número total de tabelas), 3) permitir a travessia eficiente da totalidade das tabelas.

Para um grafo Chord genérico, G, com um certo número |V (G)| de vértices, a distância máxima é dmax(G) ≈ log2|V (G)| e a distância média é d(G) ≈ dmax(G)/2 [LKRG03] (ver também seçcão 4.6.1).

Dans le document LES ACTES DE LANGAGE DANS NGUM A JEMEA OU LA FOI DAVID MBANGA EYOMBWAN. Maurice ABBA. Mme Rodolphine Sylvie WAMBA (Page 37-48)