• >0.256 TOPS AI 性能 两种 DSP 均基于相同的 SIMD 和 VLIW 架构,以及非常成功的 Vision P6/Q7 DSP 使用的指令集
Design Methods of Signal Processing Systems: • Optimization of signal processing algorithms • Compilers and tools for signal processing systems • Algorithm-to-architecture transformation • Dataflow-based design methodologies Software Implementation of Signal Processing Systems: • Software on programmable digital signal processors • Application-specific instruction-set processor (ASIP) architec- tures and systems • SIMD, VLIW, and multi-core CPU architectures • GPU-based massively parallel implementation Hardware Implementation of Signal Processing Sys- tems: • Low power/complexity signal processing circuits & applica- tions • FPGA and reconfigurable architecture-based systems • System-on-chip and network-on-chip • VLSI for sensor network and RF identification systems • Quantum signal processing • Neuromorphic computing
• 理解计算机体系结构的高级硬件和软件问题 • 理解多处理器体系结构和连接机制 • 理解多处理器内存管理 模块 I:(10 小时)微处理器和微控制器、RISC 和 CISC 体系结构、并行性、流水线基础、算术和指令流水线、流水线风险、超标量体系结构、超级流水线体系结构、VLIW 体系结构、SPARC 和 ARM 处理器。 模块 II:(10 小时)基本多处理器架构:Flynn 分类、UMA、NUMA、分布式内存架构、阵列处理器、矢量处理器。 模块 III:(10 小时)互连网络:静态网络、网络拓扑、动态网络、云计算。 模块 IV(10 小时)内存技术:缓存、缓存内存映射策略、缓存更新方案、虚拟内存、页面替换技术、I/O 子系统。 结果
市场上有几种用于 FPGA 的商用软 IP 处理器:ARM Cortex M1 [3]、Altera NIOS [5] 和 Xilinx MicroBlaze [4]。尽管提供这些处理器的目的各不相同(前者是为了让 ARM 架构在更多的开发渠道上可用,后者则是想为使用相应 FPGA 的开发人员提供完整的数字设计系统),但它们的共同点在于都基于 RISC,并且每个内核的配置能力有限(例如可选的 FPU)。虽然 ρ-VEX [8] 是一种实现可重构和可扩展的软核 VLIW 处理器的非常实用的方法,但是并行性受到指令宽度的限制。[7] 提供了可扩展的并行性。该协处理器提供复杂的矢量化能力,但不能处理非 SIMD 类并行性。传输触发架构 (TTA) [6] 由于其数据流特性,在并行性方面是可扩展的和可伸缩的。此属性的缺点是缺乏使用更复杂的功能单元以及固有的存储能力来放宽调度问题的可能性。
摘要 构建可用的量子计算机的关键在于构建可扩展、可延伸且提供实时响应的经典控制硬件流水线。该流水线的控制处理器部分提供在高级量子编程语言和使用任意波形发生器的低级脉冲生成之间进行映射的功能。在本文中,我们讨论了设计替代方案,重点是支持具有 O(10 2)量子比特的中型量子设备。我们介绍了一种评估量子 ISA 编码量子电路的有效性的方法。我们使用这种方法来评估几个设计点:类 RISC、向量和类 VLIW。我们提出了两种对广泛使用的开放 RISC-V ISA 的量子扩展。鉴于量子硬件流水线的变化速度很快,我们的开源实现为设计空间实验提供了一个良好的起点,同时我们的指标可以独立用于指导设计决策。
10:30 – 12:00 沙龙 A 会议 5a - 工作负载和系统的分析 会议主席:Antonio Gonzáles (UPC) • 理解性能下降指令的后向片段 Craig Zilles、Gurindar Sohi (威斯康星大学) • 关于存储指令的值局部性 Kevin Lepak、Mikko Lipasti (威斯康星大学) • 基于 Alpha 21264 的 Compaq ES40 系统的性能分析 Zarka Cvetanovic、RE Kessler (康柏电脑公司) 10:30 – 12:00 沙龙 B 会议 5b - 可定制的系统 会议主席:Margaret Martonosi (普林斯顿大学) • Lx:可定制 VLIW 嵌入式处理的技术平台 Paolo Faraboschi、Joseph Fisher、Geoffrey Brown、Giuseppe Desoli (惠普实验室)、Fred Homewood (ST微电子学)• 可重构缓存及其在媒体处理中的应用 Parthasarathy Ranganathan(莱斯大学)、Sarita Adve(伊利诺伊大学)、Norman Jouppi(康柏西部研究实验室)• CHIMAERA:具有紧密耦合的可重构功能单元的高性能架构 Alex Ye、Prithviraj Banerjee、Andreas Moshovos(西北大学)、Scott Hauck(华盛顿大学)