博通开始为分布式人工智能基础设施供应网络芯片

Jericho4支持分布式数据中心超过百万个处理器的交互。

来源:OSP网站大数据新闻

Broadcom 宣布首批发货下一代 Jericho4 网络芯片,旨在支持数据中心中人工智能驱动的分布式计算。

开发人员将它们称为以太网通信结构的专用路由平台,能够互连多个数据中心中超过一百万个高性能处理器 (XPU),这些数据中心之间的距离可能超过 100 公里。

新芯片采用台积电 3nm 工艺制造,符合超以太网联盟 (UEC) 规范,可与符合 UEC 标准的网卡、交换机和软件堆栈无缝集成。

Broadcom 表示,凭借高吞吐量、零丢失和增强的安全性,Jericho4 有助于克服传统人工智能基础设施的扩展限制。

Jericho4 吞吐量为 51.2 Tbps。数据包缓冲是使用高性能非易失性内存 (HBM) 完成的,Nvidia 和 AMD 在 AI 处理器中使用了这种内存,据 Broadcom 称,这有助于避免严重拥塞的网络上的数据包丢失。

支持 RoCE(融合以太网上的 RDMA)技术,可保证过载期间不会丢失数据包,还支持 HyperPort,可让您将 4 个 800GbE 端口组合成一个通道,吞吐量为 3.2 Tbit/s。

据 Broadcom 称,单个基于 Jericho4 的系统最多可扩展 36,000 个 HyperPort,每个 HyperPort 都提供深度缓冲,支持全速 MACsec(媒体访问控制安全)加密,并在超过 100 公里的距离上提供无损 RoCE 通信。

分析师认为,Jericho4可以改变面向AI的数据中心的设计理念,尤其是Amazon Web Services、Microsoft Azure和Google Cloud等超大规模数据中心的数据中心。