ANNEXES - SÉNAT AVIS

Por se tratar de uma proposta para uma arquitetura paralela, pressupõe-se que quanto mais blocos funcionais idênticos trabalhando juntos, melhor a resposta em desempenho. Porém, é preciso estudar a rela¸cão de área de hardware × desempenho, comparando-se o aumento de área e da lógica de controle contra os benef´ıcios de tempo de resposta, antes de paralelizar alguma estrutura. Nesse trabalho, foi determinado o número de cada um dos componentes principais que melhor responde a essa rela¸cão custo/benef´ıcio. Foi determinado o número de blocos paralelos para a semeadura e o número de blocos paralelos para a extensão. No Cap´ıtulo 6 são justificados, através de resultados de s´ıntese e simula¸cão, o motivo da escolha desses valores.

Para a extensão, foi poss´ıvel verificar que um número fixo de processadores de extensão, entre 2 e 5, atende na maior parte dos casos, independente do tamanho de w. Quando se ultrapassa o número de 5 processadores, o tempo ocioso de alguns processadores aumenta abruptamente e consequentemente, a melhora do tempo de execu¸cão é irrelevante, quando comparada ao acréscimo de área de hardware. Logo, optou-se por paralelizar os processadores de extensão, mas com um número fixo determinado de forma emp´ırica: 2 < p < 5.

3.1 Macro Arquitetura 62

A partir da determina¸cão do número de processadores de extensão, há a possibilidade do número de sementes geradas, de até (n − w + 1) por ciclos, ser diferente da quantidade de processadores de extensão existentes. Por esse motivo, fez-se necessário desenvolver um componente para controlar o acesso das sementes encontradas e balancear o tráfego entre os processadores de extensão, de modo a distribuir a carga de forma otimizada entre os processadores de extensão. Esse componente, é o árbitro que está descrito a seguir.

A inser¸cão de múltiplos processadores que podem ser compartilhados por mais de uma linha de dados traz consigo, além da divisão da carga de trabalho, a necessidade de controle de acesso dos barramentos de entrada e sa´ıda, assunto amplamente abordado nos protocolos de comunica¸cões (TANENBAUM, 2000).

Para a tarefa de divisão da carga de trabalho, importou-se da teoria de sistemas operacionais, os conceitos necessários para a constru¸cão do árbitro, que é também um escalonador. Versa a teoria de sistemas operacionais que, numa arquitetura paralela, é fact´ıvel 2 ou mais processos estarem aptos a utilizar um processador para ser executado. Nesse instante, o sistema operacional deve decidir qual dos processos aptos, armazenados em uma fila, será escolhido para rodar primeiro. Essa tarefa e a tomada de decisão é feita pelo escalonador de processos através da implementa¸cão de alguns algoritmos de sele¸cão, denominados algoritmos de escalonamento. O escalonador é a entidade do sistema operacional responsável por selecionar um processo apto a executar no processador e dividir o tempo do processador de forma justa entre os processos que estão aptos (OLIVEIRA; CARISSIMI; TOSCANI, 2010).

A Figura 5, mostra que são (n−w +1) blocos que executam a semeadura paralelamente. Na sa´ıda de cada um desses blocos há uma fila, que armazena as sementes encontradas ao longo do processo até que haja um processador dispon´ıvel. Essas (n − w + 1) filas, foram constru´ıdas no padrão fifo (first in first out). Cada semente armazenada, é um processo apto aguardando o processador para ser executado, e quando selecionadas, precisam ser roteadas para um dos processadores de extensão através do barramento de dados.

O árbitro destaca-se por realizar três importantes fun¸cões simultaneamente. Para os processadores que realizam a extensão, executa a fun¸cão de escalonador. Há também a interface entre semeadura e extensão, com os barramentos dados, exercendo a fun¸cão de controlador de barramentos. Para as filas localizadas na sa´ıda de cada um dos (n−w +1) blocos que executam a semeadura paralelamente, o árbitro monitora a ocupa¸cão essa filas, na fun¸cão de gerenciador de filas.

3.1 Macro Arquitetura 63

Tabela 11: L´ogica de desempate entre filas

Requisi¸c˜ao da Fila Resposta do Balanceador Opera¸c˜ao Resultante

XXX1 0001 POP na fila 1

XX1X 0010 POP na fila 2

X1XX 0100 POP na fila 3

1XXX 1000 POP na fila 4

dade para enviar sua etiqueta para o processador de extensão dispon´ıvel. O ganho obtido com esse gerenciador de fila permite que o número de processadores seja independente do numero de filas e módulos de compara¸cão.

Como descrito acima, foi necessário inserir uma memória do tipo fifo (first in first out) para armazenar as sementes até que essas fossem estendidas pelos processadores. A largura da fifo é determinada pelo tamanho das palavras, enquanto sua profundidade é derivada do número de processadores de extensão inclu´ıdos, de modo que quando há um tempo médio necessário para os processadores liberarem os dados, há necessidade de uma fila mais profunda. A menos que a fifo esteja cheia, a etapa de semeadura não vai interferir no processo de extensão, pois as sementes serão gradativamente armazenadas na fifo.

Entre a sa´ıda das filas no padrão fifo e os processadores de extensão, há o árbitro que monitora as filas e toda vez que um processador está dispon´ıvel, direciona a semente contida na fila prioritária para ser estendida. Esse monitoramento é feito através de flags oriundos dos processadores e das filas. Para escalonar os processadores, o algoritmo utilizado é o round-robin, que direciona trabalho aos processadores de forma circular, a cada rodada. Caso o processador da rodada ainda esteja ocupado, o próximo processador é escolhido.

A lógica de controle para escolher a fila prioritária, é sempre escolher a fila mais cheia, isto é, com mais posi¸cões ocupadas. Caso duas ou mais filas estejam igualmente ocupadas, o critério de desempate é a fila de menor número, como é visto na Tabela 11.

O princ´ıpio de funcionamento da fun¸cão do gerenciador de filas do árbitro é monitorar os sinais de flag de cada fila identificando qual deve ser a prioritária, por estar mais cheia. Caso mais de uma fila esteja cheia e não haja processadores de extensão dispon´ıveis para todas elas, o árbitro gera uma interrup¸cão para o controlador global, que irá desabilitar o clk da etapa de semeadura até que as filas tenham posi¸cões dispon´ıveis para receber novas sementes. A Figura 6 mostra a lógica combinacional para conceder do barramento à uma fila, a partir da requisi¸cão do processador da rodada, repassado pelo árbitro. O árbitro determina o id da fila a ser usada, baseado nas posi¸cões das filas. Esse id fornecido pelo árbitro é comparado com o id de cada fila, e quando há a requisi¸cão, a lógica habilita o buffer tri-state somente da fila escolhida.

3.1 Macro Arquitetura 64 fifo& out posições& comp& prior'( n fila)*+', = ≠ rqst Árbitro rqst in _fifo - out posições- comp- prior '( 0 fila) *+', = ≠ rqst in ... prior'(

Figura 6: Controle de barramento e prioridade

A escolha da fila a ser utilizada só acontece quando existe um processador livre, soli- citando através de um sinal de requisi¸cão uma nova semente para então processá-la. No caso de todos os processadores de extensão estarem livres ao mesmo tempo, o árbitro, na fun¸cão de escalonador, prioriza o processador de menor número, em detrimento dos demais. A escolha do processador de extensão que será utilizado, quando mais de um estiver requisitando dados, é como descrito, feito através do algoritmo round-robin.

Todas as memórias contidas na semeadura, são do padrão de fila fifo, first in first out. Para o gerenciamento dessas filas, importou-se um bloco IP (Intellectual Property), artif´ıcio utilizado sempre que um componente ou bloco é devidamente difundido, como é o caso dos módulos de memória, sem que seja acrescentada nenhuma especificidade para o projeto em questão.

Dans le document SÉNAT AVIS (Page 67-76)