摘要 - 透明粒度可重构阵列(CGRA)是一种有前途的解决方案,可以使来自不同域的应用加速加速。通过利用功能级别的重新配置,它们可以适应显着不同的计算模式。但是,电压和频率与CGRA资源的利用及其动态管理的关系尚未很好地探索,从而导致设计效率低下。CGRA也成功地加速了数据依赖的流媒体应用程序。但是,在这些应用中,管道中每个内核的执行时间可能会根据输入的特性而动态变化。这也导致资源不足,用于动态变化的内核,而内核不会限制应用程序吞吐量。dvfs还可以通过动态更改主持非绩效构成内核的瓷砖的电压和频率水平来提高这些应用的能源效率。本文提出了ICED - 一项集成的DVFS感知框架 - 绘制支持电源岛的CGRA应用程序。ICED提出了一个CGRA架构,以不同的粒度(从单个瓷砖到一组瓷砖)以及相关的DVFS感知汇编和映射工具链,以不同的粒度(从单个瓷砖到一组瓷砖)为支持DVFS群岛。ICED是在电力岛级别引入对时空CGRA的DVF支持的第一部作品。实验评估表明,与常规CGRA相比,冰的平均利用率提高了2.3倍,能源效率提高了1.32倍。使用流应用程序,与最先进的CGRA相比,ICED可以达到高达1.26×能量效率,该最先进的CGRA引入了部分动态重新配置以适应内核吞吐量的变化。
简介 ƒ 粗粒度可重构阵列 (CGRA) 可提供高能效,同时保持可编程性优势。 ƒ CGRA 是高效处理循环内核的理想选择,它允许它从 CPU 卸载重复循环函数,例如向量乘法或散列算法。 ƒ 它依靠编译器将给定的工作负载转换为数据流图 (DFG),然后以实现最高能效的方式将其映射到硬件上。
摘要 —近年来,粗粒度可重构架构 (CGRA) 加速器越来越多地部署在物联网 (IoT) 终端节点中。现代 CGRA 必须支持并有效加速整数和浮点 (FP) 运算。在本文中,我们提出了一种超低功耗可调精度 CGRA 架构模板,称为 TRANSprecision 浮点可编程架构 (TRANSPIRE),及其支持整数和 FP 运算的相关编译流。TRANSPIRE 采用跨精度计算和多个单指令多数据 (SIMD) 来加速 FP 操作,同时提高能源效率。实验结果表明,TRANSPIRE 实现了最大 10.06 × 的性能提升并且消耗 12 .相对于基于 RISC-V 的 CPU,其能耗降低了 91 倍,并且具有支持 SIMD 样式矢量化和 FP 数据类型的增强型 ISA,同时执行近传感器计算和嵌入式机器学习的应用程序,面积开销仅为 1.25 倍。
Julie S. Mak,MS,MSc,CGC(她/她)遗传咨询师 UCSF Monique Tiffany,MSN,RN,CGRA,BHCN(她/她)医学科学联络员 Myriad Genetics
在暗硅时代,硬件专业化通常被视为扩展性能的一种方式,现代 SoC 具有数十个专用加速器。通过仅在需要时启动硬件电路,加速器从根本上以芯片面积换取功率效率。然而,暗硅也有一个严重的缺点,那就是它的环境足迹。虽然硬件专业化通常通过高能源效率来减少操作足迹,但是在芯片上集成额外加速器所产生的具体足迹会导致环境足迹的总体净增加,这导致先前的研究得出结论,暗硅不是一种可持续的设计范式。我们通过可重构逻辑探索可持续的硬件专业化,与大量加速器相比,它有可能通过在多个应用程序中摊销其具体足迹来大幅减少环境足迹。我们提出了一个抽象的分析模型,评估用可重构加速器替换专用加速器的可持续性影响。我们针对各种内核,推导出 ASIC 和 CGRA(一种代表性的可重构结构)的芯片面积和能量数字的硬件综合结果。我们将这些结果输入到分析模型中,并得出结论:可重构结构更具可持续性。我们发现,CGRA 可以取代少量到十几个加速器。此外,用 CGRA 取代大量加速器可以大大减少对环境的影响(减少 2.5 倍到 7.6 倍)。
直到最近,计算机系统的性能和功率效率才随着摩尔定律的扩展和 Dennard 缩放的晶体管效率的提高而稳步提高。然而,现在由于物理限制,设备缩放在性能和功率改进方面遇到了限制。为了在后摩尔和后 Dennard 时代继续生产快速且节能的计算机系统,计算机架构师和系统设计师正在朝着令人兴奋的新方向发展。一个方向是转向并行计算机架构和系统,包括多核和众核处理器、并行执行模型以及新的缓存一致性和内存一致性模型。另一个方向是整合异构和专用加速器,包括 GPU、TPU、FPGA、CGRA 和 ASIC。第三个方向是出现全新的硬件和软件系统,包括量子计算、基于 DNA 的计算机系统、神经形态计算和间歇性计算。本课程将首先回顾计算机设计的基本原理和指令集原理,然后研究当今计算机设计的基本原理,包括高级流水线、指令级并行、内存层次设计、存储系统、互连网络和多处理器。我们还将通过阅读和讨论研究论文、听取和发表技术演讲、在真实和模拟硬件上运行实验以及规划和开展学期研究项目来探索上述三个新方向。本课程将帮助学生为涉及高级计算机架构和系统方面的研究做好准备,或者为国家实验室或公司工作,开发或使用高级架构用于高性能计算、大规模数据分析或机器学习的应用。课程先决条件
•美国西北大学SEDA OGRENCI•美国AMD的Stephen Neuendorffer•NHAN TRAN,美国费米拉布,美国•弗雷德里克·克乔尔斯塔德(Fredrik Kjolstad),美国斯坦福大学,美国•英国剑桥,德比亚斯·格罗瑟(Tobias Grosser)开源软件的流行率,以及对开源硬件的兴趣越来越多,可重新配置的技术在很大程度上是由专有的,封闭的工具提供的,这些工具与专有硬件架构紧密相关。鉴于这些工具和体系结构的复杂性,缺乏开放源解决方案历史上为该地区的教育,研究和创新带来了重大障碍。但是,最近,新的开源工具和方法涵盖了高水平合成和物理设计流的整个范围。在新型加速器体系结构支持机器学习的最新爆炸中,似乎正在重复类似的模式。尽管CPU和GPU体系结构的汇编通过大量开源项目(例如GCC和Clang/LLVM)支持了对新型Accelerator Architectures的支持,但尚未上游。本期特刊的目的是强调与可重构设备有关的开源软件和硬件技术的最新研究和开发,例如FPGA和CGRA,以及其他新型的加速器架构。它将包含涵盖广泛主题的文章,包括用于设计,优化,调试和机器学习的开源工具,针对从单个设备到分布式系统以及开源硬件和系统设计的广泛设计范围。本期特刊将成为嵌入式系统,计算机架构,设计自动化,特定领域的加速度和其他相关领域领域的研究人员,工程师和从业人员的宝贵资源,而感兴趣的主题包括但不限于以下开源解决方案:
ACH :Automated Clearing House ACU :Asian Clearing Union AD :Authorized Dealer AFS :Annual Financial Statement ALM :Asset-Liability Management AML :Anti-Money Laundering APR :Annual Percentage Rate ATM :Automated Teller Machine BACH :Bangladesh Automated Clearing House BCBS :Basel Committee on Banking Supervision BFIU :Bangladesh Financial Intelligence Unit BGTB :Bangladesh Government Treasury Bonds BoP :Balance of Payments CBS :Core Banking Solution CC :Cash Credit CCY :Currency CD :Certificate of Deposit CMSME : Cottage Micro Small and Medium Enterprise CRG :Credit Risk Grading CRM :Cash Recycling Machine CDR :Credit Deposit Ratio CFRA :Combined Finance and Revenue Accounts CGRA :Currency and Gold Revaluation Account CL :Classified Loan CO :Capital Outlay CPI :Consumer Price Index CRAR :Capital to Risk-Weighted Asset比率CRR:现金储备比率CPV:每次查看CTR:现金交易报告DD:DPD:过去到期日的需求草案:EFT日期:电子资金转移:环境风险转移ERQ ERQ:出口商保留配额EXP:Export fatca exp:Export FATCA FATCA:外国帐户税收合规性ACT FCCB:外国货币兑换货币投资公司FCNRA FCNRA:外汇FCNRA:外汇FCNRIC FCNRIC FCNRIC FCNRIC FCNRIC FDIC:外汇FDI:FDI:FDI:FDI: :基金流量FPI:外国投资组合投资FPP:固定个人薪酬GDP:国内生产总值GL:总账GRR:全球存储库收据IBAN:国际银行帐户IBAS IBAS IBAS:ICC的综合预算和会计系统ICC:内部控制和合规性ICRR ICRR:内部信用风险ICRR:内部信用风险ILF:INSTAY流动性设施