• Aucun résultat trouvé

Computational Methods Covered in This Book

Dans le document URLs Referenced in This Book (Page 56-62)

Chapter 2. Computational Approaches to Biological Questions

2.4 Computational Methods Covered in This Book

Os dados abaixo foram retirados dos softwares Vivado 2018.3 da Xilinx e Quartus Prime Lite Edition 18.1 da Intel. O projeto foi implementado em uma placa xcku035- ffva1156-1LV-i da Xilinx e em uma Cyclone V 5CGXFC9E7F35C8 da Intel.

As placas foram escolhidas por conter um alto número de portas I/O, em relação às placas da versão gratuita do software. Abaixo, na tabela 3, vemos a quantidade de Look up Tables, FlipFlops e DSPs separadas por unidade.

Tabela 3: Resultados de Área por bloco Unidade LUTs FlipFlops DSPs

ULA 63 0 0

Multiplicador 15 0 3 Multiplexador 32 0 0 Nível 13747 0 3 Array 42563 12601 9

Para a placa da Xilinx, o programa nos apresenta uma frequência máxima de 57,803 MHz. Já para a placa da Intel, o software nos dá as frequências de 34,230 MHz para o modelo mais lento e 70,130 MHz para o modelo mais rápido.

35

6

Considerações finais

O presente trabalho apresentou uma pesquisa sobre diferentes formas de implemen- tação de aceleradores de arquitetura reconfigurável. Dentre elas, podemos notar diversas características diferentes, como o nível de acoplamento, granularidade e tradução binária estática ou dinâmica.

Baseando-se em um dos trabalhos pesquisados, foi desenvolvida uma implementação própria de um array de arquitetura reconfigurável para funcionar fortemente acoplado a um processador de propósito geral. Vimos que em situação ótima o acelerador implemen- tado pode acelerar em até onze vezes a performance do processador. Entretanto como aplicações reais possuem dependências de dados entre suas instruções os testes foram feitos em aplicações sintéticas geradas aleatoriamente. Nestes vemos que foi obtida uma aceleração de 2.46x em média, com um pico de 5.33x.

Obtivemos também o resultado de que a frequência necessária para o funcionamento do acelerador pode ser de 34,230 MHz até 70,130 MHz. Essa frequência é mais baixa do que a da maior parte dos processadores atuais e inclusive do MIPS R10000. Isso significa que podemos utilizar o acelerador sem aumento da frequência do processador, evitando uma maior dissipação de potência.

Para trabalhos futuros é vamos implementar uma versão mais complexa do array, explorando ainda mais o paralelismo do mesmo. Explorar outras configurações, aplicando mais linhas de UFs para cada unidade de acesso à memória. Ver a diferença do tempo de execução entre UFs e multiplicadores. Também é interessante fazer um teste físico descendo ainda mais o nível e acoplando-o a um processador real.

Além do mais, serão executados benchmarks mais conhecidos, diferentes de aplicações sintéticas.

36

Referências

AMDAHL, G. M. [acm press the april 18-20, 1967, spring joint computer conference - atlantic city, new jersey (1967.04.18-1967.04.20)] proceedings of the april 18-20, 1967, spring joint computer conference on - afips ’67 (spring) - validity of the single processor approach to achieving large scale computing capabilities. In: . [s.n.], 1967. Disponível em: <http://gen.lib.rus.ec/scimag/index.php?s=10.1145/1465482.1465560>.

BAE INPYO; HARRIS, B. M. H. E. B. Auto-tuning cnns for coarse-grained reconfigurable array-based accelerators. IEEE Transactions on Computer- Aided Design of Integrated Circuits and Systems, IEEE, 2018. Disponível em: <http://gen.lib.rus.ec/scimag/index.php?s=10.1109/TCAD.2018.2857278>.

BECK, A. C. S. Transparent reconfigurable architecture for heterogeneous applications. Tese (Doutorado) — Universidade Federal do Rio Grande do Sul, 2008.

BECK, A. C. S.; RUTZIG, M. B.; CARRO, L. A transparent and adaptive reconfigurable system. Microprocessors and Microsystems, Elsevier, v. 38, n. 5, p. 509–524, 2014. BECK, A. C. S. et al. Transparent reconfigurable acceleration for heterogeneous embedded applications. In: IEEE. Design, Automation and Test in Europe, 2008. DATE’08. [S.l.], 2008. p. 1208–1213.

BRANDALERO MARCELO; BECK, A. C. S. Potential analysis of a superscalar core employing a reconfigurable array for improving instruction-level parallelism. Design Au- tomation for Embedded Systems, Springer US, v. 20, 6 2016.

CIFUENTES, C.; MALHOTRA, V. Binary translation: static, dynamic, retargetable? In: 1996 Proceedings of International Conference on Software Maintenance. [S.l.: s.n.], 1996. p. 340–349. ISSN 1063-6773.

COMPTON KATHERINE; HAUCK, S. Reconfigurable computing: a survey of systems and software. ACM Computing Surveys, Association for Computing Machinery, v. 34, 6 2002.

DEHON, A. Dpga-coupled microprocessors: Commodity ics for the early 21st century. In: IEEE. FPGAs for Custom Computing Machines, 1994. Proceedings. IEEE Workshop on. [S.l.], 1994. p. 31–39.

ESTRIN, G. Organization of computer systems: the fixed plus variable structure com- puter. In: ACM. Papers presented at the May 3-5, 1960, western joint IRE-AIEE-ACM computer conference. [S.l.], 1960. p. 33–40.

FENG, . L. Y. C. [ieee 2013 international conference on mechatronic sciences, electric en- gineering and computer (mec) - shengyang, china (2013.12.20-2013.12.22)] proceedings

37

2013 international conference on mechatronic sciences, electric engineering and com- puter (mec) - design and evaluation of a novel reconfigurable alu based on fpga. In: . [s.n.], 2013. ISBN 978-1-4799-2565-0,978-1-4799-2564-3,978-1-4799-2563-6,. Disponível em: <http://gen.lib.rus.ec/scimag/index.php?s=10.1109/mec.2013.6885424>.

FLYNN M.J.; HUNG, P. Microprocessor design issues: thoughts on the road ahead. IEEE Micro, IEEE, v. 25, 2005.

FONTANA, R. E.; DECAD, G. M. Moore’s law realities for recording systems and memory storage components: Hdd, tape, nand, and optical. AIP Advances, v. 8, n. 5, p. 056506, 2018. Disponível em: <https://doi.org/10.1063/1.5007621>.

HANNIG, F. et al. System integration of tightly-coupled processor arrays using reconfigu- rable buffer structures. In: Proceedings of the ACM International Conference on Compu- ting Frontiers. New York, NY, USA: ACM, 2013. (CF ’13), p. 2:1–2:4. ISBN 978-1-4503- 2053-5. Disponível em: <http://doi.acm.org/10.1145/2482767.2482770>.

HARTENSTEIN, R. A decade of reconfigurable computing: A visionary retrospective. In: Proceedings of the Conference on Design, Automation and Test in Europe. Piscataway, NJ, USA: IEEE Press, 2001. (DATE ’01), p. 642–649. ISBN 0-7695-0993-2. Disponível em: <http://dl.acm.org/citation.cfm?id=367072.367839>.

HARTENSTEIN, R.; KAISERSLAUTERN, T. Basics of reconfigurable computing. In: . Designing Embedded Processors: A Low Power Perspective. Dordrecht: Springer Netherlands, 2007. p. 451–501. ISBN 978-1-4020-5869-1. Disponível em: <https://doi.org/10.1007/978-1-4020-5869-1_20>.

HAUSER, J. R.; WAWRZYNEK, J. Garp: A mips processor with a reconfigurable copro- cessor. In: IEEE. Field-Programmable Custom Computing Machines, 1997. Proceedings., The 5th Annual IEEE Symposium on. [S.l.], 1997. p. 12–21.

JRIDI MAHER; ALFALOU, A. M. P. K. A generalized algorithm and reconfigurable architecture for efficient and scalable orthogonal approximation of dct. IEEE Transactions on Circuits and Systems I: Regular Papers, v. 62, 2 2015.

KACHRIS, C.; SOUDRIS, D. A survey on reconfigurable accelerators for cloud computing. In: 2016 26th International Conference on Field Programmable Logic and Applications (FPL). [S.l.: s.n.], 2016. p. 1–10. ISSN 1946-1488.

KIM N.S.; AUSTIN, T. B. D. M. T. F. K. H. J. I. M. K. M. N. V. Leakage current: Moore’s law meets static power. Computer, IEEE, v. 36, 2003.

KUMAR, S. Fundamental limits to moore’s law. arXiv preprint arXiv:1511.05956, 2015. KUMAR SANTOSH; MANIKANDAN, J. A. V. K. [ieee 2017 international conference on advances in computing, communications and informatics (icacci) - udupi (2017.9.13- 2017.9.16)] 2017 international conference on advances in computing, communications and informatics (icacci) - hardware implementation of support vector machine classifier using reconfigurable architecture. In: . [S.l.: s.n.], 2017. ISBN 978-1-5090-6367-3.

38

PAEK JONG KYUNG; CHOI, K. L. J. Binary acceleration using coarse- grained reconfigurable architecture. ACM SIGARCH Computer Architecture News, Association for Computing Machinery, v. 38, 01 2011. Disponível em: <http://gen.lib.rus.ec/scimag/index.php?s=10.1145/1926367.1926374>.

PRABHAKAR RAGHU; ZHANG, Y. K. D. F. M. Z. T. H. S. P. A. K. C. O. K. Plasticine: A reconfigurable accelerator for parallel patterns. IEEE Micro, IEEE, v. 38, 5 2018. Dis- ponível em: <http://gen.lib.rus.ec/scimag/index.php?s=10.1109/MM.2018.032271058>. RAZDAN, R.; SMITH, M. D. A high-performance microarchitecture with hardware- programmable functional units. In: ACM. Proceedings of the 27th annual international symposium on Microarchitecture. [S.l.], 1994. p. 172–180.

SINGH H.; MING-HAU LEE; GUANGMING LU; KURDAHI, F. B. N. C. F. E. Morphosys: an integrated reconfigurable system for data-parallel and computation- intensive applications. IEEE Transactions on Computers, IEEE, v. 49, 2000. Disponível em: <http://gen.lib.rus.ec/scimag/index.php?s=10.1109/12.859540>.

SITES, R. L. et al. Binary translation. Digital Technical Journal, DIGITAL EQUIPMENT CORP, v. 4, p. 137–137, 1993.

Tekleyohannes, M. K. et al. A reconfigurable accelerator for morphological operations. In: 2018 IEEE International Parallel and Distributed Processing Symposium Workshops (IPDPSW). [S.l.: s.n.], 2018. p. 186–193.

THOMPSON S.E.; CHAU, R. G. T. M. K. T. S. B. M. In search of “forever,” conti- nued transistor scaling one new material at a time. IEEE Transactions on Semiconductor Manufacturing, IEEE, v. 18, 02 2005.

WALL, D. W. [acm press the fourth international conference - santa clara, california, united states (1991.04.08-1991.04.11)] proceedings of the fourth international conference on architectural support for programming languages and operating systems - asplos-iv - limits of instruction-level parallelism. In: . [S.l.: s.n.], 1991. ISBN 0897913809.

YUN, Z. et al. Design of reconfigurable array processor for multimedia application. Mul- timedia Tools and Applications, v. 77, n. 3, p. 3639–3657, Feb 2018. ISSN 1573-7721. Disponível em: <https://doi.org/10.1007/s11042-017-5284-7>.

Dans le document URLs Referenced in This Book (Page 56-62)