摘要 — 随着深度学习算法的进步超越硬件的进步,您如何确保未来的算法能够很好地适应正在开发的现有 AI 芯片?大多数 AI 芯片都是为当今的 AI 算法设计的,鉴于算法演进的速度和规模,许多 AI 芯片设计甚至在商业发布之前就可能过时。未来的算法需要彻底改革架构、内存/数据资源和功能。理想的推理架构必须重新定义一些基本的芯片技术,这些技术将重写计算规则,并提供突破性的 AI 加速和灵活的计算能力,超越服务器级 CPU,比 GPU/ASIC 更灵活,以支持广泛的应用程序和动态工作负载。本文将讨论如何使用 Xilinx VERSAL AI Core(业界首款 ACAP(自适应计算加速平台)设备,超越 CPU/GPU 和 FPGA 的性能)在硬件和软件设计的各个层面解决这些行业挑战。
主要关键词