Nvidia 打算显着加快推理速度

该公司通过将 Groq 技术集成到混合推理平台中,巩固了其在人工智能市场的主导地位。

来源:OSP网站大数据新闻

Nvidia计划发布一款旨在加速AI模型推理速度的新处理器,旨在帮助OpenAI和其他客户创建更高效​​的AI解决方案。这应该会导致英伟达业务发生重大变化,该公司的产品在模型训练领域占据主导地位,因为该公司现在打算大幅加强其在逻辑结论形成方面的地位。

Nvidia 还在开发一个用于加速 AI 推理(即模型实时生成结果)的新平台,这将使 AI 模型能够更快地响应查询。它将于 3 月份在圣何塞举行的 Nvidia GTC 2026 开发者大会上亮相,据称将 Groq 的语言处理单元 (LPU) 处理器技术与 Nvidia 可预测的低延迟确定性架构和 CUDA 生态系统相结合,将 GPU 和“语言”处理器的功能结合在混合推理解决方案中。

Groq 是一家美国初创公司,专注于加速人工智能推理的芯片和软件。 2025年12月,Nvidia与Groq签订了价值200亿美元的许可协议,收购资产、LPU技术和领导员工。现在,Nvidia 正在将 Groq 技术集成到“人工智能工厂”中,其中之一将在圣何塞展出。