Nvidia 打算显着加快推理速度 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

Nvidia 打算显着加快推理速度

2026年3月2日 07:01 33 Comments

该公司通过将 Groq 技术集成到混合推理平台中，巩固了其在人工智能市场的主导地位。

来源:OSP网站大数据新闻

Nvidia计划发布一款旨在加速AI模型推理速度的新处理器，旨在帮助OpenAI和其他客户创建更高效的AI解决方案。这应该会导致英伟达业务发生重大变化，该公司的产品在模型训练领域占据主导地位，因为该公司现在打算大幅加强其在逻辑结论形成方面的地位。

Nvidia 还在开发一个用于加速 AI 推理（即模型实时生成结果）的新平台，这将使 AI 模型能够更快地响应查询。它将于 3 月份在圣何塞举行的 Nvidia GTC 2026 开发者大会上亮相，据称将 Groq 的语言处理单元 (LPU) 处理器技术与 Nvidia 可预测的低延迟确定性架构和 CUDA 生态系统相结合，将 GPU 和“语言”处理器的功能结合在混合推理解决方案中。

Groq 是一家美国初创公司，专注于加速人工智能推理的芯片和软件。 2025年12月，Nvidia与Groq签订了价值200亿美元的许可协议，收购资产、LPU技术和领导员工。现在，Nvidia 正在将 Groq 技术集成到“人工智能工厂”中，其中之一将在圣何塞展出。

推理 Nvidia 美国加速人工智能 LPU 可预测的模型公司技术许可 AI 速度的旨在生态系统 Groq 圣何塞处理器

Nvidia 打算显着加快推理速度

其他外部链接

Tags

XiaoMi-AI