谷歌宣布推出用于各种人工智能任务的张量处理器

分离张量处理器的功能应该可以提高其在生产环境中的效率和成本效益。

来源:OSP网站大数据新闻

谷歌正在回归张量处理器功能分离的策略,推出两款新的第八代芯片,其中一款用于训练人工智能模型,另一款用于生成逻辑推理。分析师表示,这种分离表明硬件适应企业人工智能生命周期的不同阶段,应该会提高其在生产环境中的效率和盈利能力。

例如,根据 HFS Research 的研究,训练和推理在经济性、内存特性、网络需求以及希望在模型生命周期的每个阶段优化性价比的用户需求方面存在差异。 Forrester 专家表示,在两种张量处理器选项之间进行选择的能力将有助于公司避免重新训练在其他平台上训练的现成模型以在 Google Cloud TPU 和 TensorFlow 生态系统中工作的成本。

谷歌此前曾尝试过差异化的第五代 TPU 变体 - V5p 和 V5e,用于高性能模型训练以及更具成本效益的推理和更小规模的训练。在 Google Cloud Next 2026 大会上,公司代表分别发布了最新的 8t 和 8i TPU 芯片,用于训练和推理。与 Ironwood 处理器相比,TPU 8t 每个 SuperPOD 的性能几乎是 Ironwood 处理器的三倍、更大的 SuperPod 以及两倍的芯片间互连带宽。据谷歌称,包含 9,216 个 Ironwood 芯片的 SuperPOD 模块可提供 42.5 EFLOPS,而 9,600 TPU 8t 模块可提供 121 EFLOPS,同时将双向芯片到芯片吞吐量提高一倍,达到每芯片 19.2 Tbps,并将网络吞吐量提高四倍,达到 400 Gbps。