摘要:在人工智能的时代,卷积神经网络(CNN)正在成为一种用于图像处理的强大技术,例如去核,超分辨率甚至样式转移。他们表现出很大的潜力,可以将下一代相机和展示带入我们的日常生活。但是,传统的CNN加速器很难在边缘生成超高分辨率视频,因为它们的大量急速带宽和功耗。例如,用于降级的高级FFDNET可能需要131 GB/s的DRAM带宽,而在4K UHD 30FPS处则需要106个计算顶部。在这次演讲中,我将介绍我们最近的两部作品,以应对DRAM带宽和功耗的挑战。首先,我将讨论图像处理CNN带来的图像二线革命并阐述其设计挑战;为了清楚起见,他们与识别CNN的差异将得到强调。然后,我将以整体方式介绍我们的第一份作品 - ECNN [Micro'19],共同优化推理流,网络模型,指令集和处理器设计。尤其是,具有面向硬件的ERNET模型的基于块的推理流可以支持FFDNET级DINOISING和SRRESNET级超分辨率,在4K UHD 30 FPS下使用小于2 GB/s的DRAM带宽。最后,我将介绍我们的第二件作品(ISCA'21],它利用了Ring Argebra的常规稀疏度,以实现近乎最大的硬件节省和优雅的卷积发动机质量降解。布局结果表明,可以分别使用3.76 W和2.22 W进行等效的41个高位计算,分别以40 nm的技术为50%(无质量下降)和75%和75%(PSNR下降的0.11 dB)。
• ACM/IEEE 国际计算机辅助设计会议 (ICCAD) 2024 • 嵌入式系统编译器、架构与综合国际会议 (CASES/ESWEEK) 2024 • MLCommons ML 和系统新星,2024、2023 • IEEE 集成电路与系统计算机辅助设计学报,2024- 2019 • 第 1 届 IEEE LLM 辅助设计国际研讨会,2024 • PhD Forum@DAC,2024、2023 • IEEE 计算机架构快报,2024、2022 • 国际高质量电子设计研讨会 (ISQED) [系统级设计和方法 (SDM) 轨道联合主席],2024 • 系统和软件性能分析国际研讨会 (ISPASS),2024 • 设计自动化会议 (DAC), 2024-2020 • 国际计算机设计会议 (ICCD),2024 -2021 • IEEE 计算机学会 VLSI 年度研讨会 (ISVLSI),2023 • VLSI 设计会议 (VLSID),2023 • ACM 嵌入式计算系统学报,2023 • 学生研究论坛 (SRF)@ASP-DAC,2023 • IEEE 电路与系统学报 II:快速摘要,2023-2021 • ACM 传感器网络学报,2023 • IEEE 嵌入式系统快报,2023、2020、2019 • 未来一代计算机系统,2023 • 机器学习与系统会议 (MLSys),2022 • ACM 电子系统设计自动化学报,2022 • IEEE 无线通信学报,2022 • IEEE 物联网期刊,2022 • IEEE国际工作负载特性研讨会 (IISWC),2021 年 • 国际计算机体系结构研讨会 (ISCA),2021 年 • 国际并行与分布式处理研讨会 (IPDPS),2021 年 • IEEE 电路与系统学报,2021 年 • IEEE 电路与系统新兴与选定主题期刊,2021 年、2019 年、2018 年 • 低功耗电子与应用期刊,2021 年 • 并发与计算:实践与经验,2021 年 • USENIX OSDI 工件评估委员会,2020 年 • ACE 架构与代码优化学报,2020 年 • IEEE 电路与系统开放期刊,2020 年 • IEEE 超大规模集成系统学报,2019 年、2018 年 • 系统体系结构期刊,2019 年 • IEEE Access,2018 年 • 模式识别与人工智能期刊, 2017 年 • IEEE 设计与测试,2016 年 • 国际并行编程杂志,2016 年
