Nvidia 开发了一款能够同时处理超过一百万个代币的芯片 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

Nvidia 开发了一款能够同时处理超过一百万个代币的芯片

2025年10月9日 13:27 33 Comments

该公司正在基于新的Rubin架构开发基础设施并提高“AI工厂”的效率

来源:OSP网站大数据新闻

Nvidia 宣布推出下一代 AI GPU 和机架式平台，旨在处理大量数据、编码令牌和创建生成视频。新芯片基于 Nvidia 的下一代 Rubin 架构，取代了 Blackwel 技术。

Core Rubin GPU，专为人工智能训练和推理而设计，支持长上下文窗口。它由两个性能为 25 PFLOPS 的处理器芯片、一个 NVLink 互连和 288 GB 高性能 HBM4 内存组成。

Rubin CPX 处理器包含一个性能高达 30 PFLOPS 的芯片，可用于 4 位 NVFP4 数据格式的操作，以及 128 GB GDDR7 内存。该芯片专为人工智能推理和长上下文模型而设计，能够同时处理超过一百万个令牌。 Rubin CPX 支持硬件视频编解码。

Nvidia 声称，GDDR7 内存具有足够的性能，与 GB300 NVL72 系统相比，Rubin CPX 处理器在处理长上下文时可提供三倍的加速。还有报道称，Rubin CPX 比 Rubin 更便宜，但没有具体数据。

Nvidia 解释说，Rubin CPX 处理器旨在提高推理过程预填充阶段计算大型语言模型的性能。他们与带有高速 HBM 内存的 Rubin 芯片联合工作，在该过程的生成阶段输出结果，应该会显着提高人工智能工厂的性能。

双机架配置将 Vera 处理器和 Rubin GPU 放置在一个机架中，将 Rubin CPX 放置在另一个机架中。因此，可以购买不带 CPX 服务器、在单独机架中安装 CPX 服务器以及“混合”服务器配置的系统。