详细内容或原文请订阅后点击阅览
在微软中,他们试图应对过热AI Systems div>
Intel X86核和NVIDIA RTX图形的整合将确保能耗和功能的效率,而竞争者根本没有任何对比。
来源:OSP网站大数据新闻人工智能和高性能计算工作负载对数据中心基础设施提出了前所未有的要求,而数据中心基础设施越来越无法应对新一代处理器产生的热量和人工智能硬件不断增加的功率密度。根据 Fab Economics 对人工智能基础设施总拥有成本的分析,到 2025 年,超过 45-47% 的数据中心能源成本用于冷却,在不提高效率的情况下,这一数字可能达到 65-70%。 2024年,Nvidia Hopper H100 GPU的功耗为700 W,2025年随着Blackwell B200和Blackwell Ultra B300的发布,功耗增加到1000 W和1400 W,2026年Rubin和Rubin Ultra出现后,功耗将分别达到1800 W和3600 W。
微软提出的人工智能芯片创新冷却技术应该有助于解决这个问题。它基于所谓的微流体,直接向微电路提供少量液体。微软认为,此类技术可以从根本上改变热管理方法,提高数据中心的能源效率并降低运营成本。
微流体并不是一个新概念,目前最大的挑战是扩展技术。 TechInsights 的分析师解释说,微米通道使芯片制造变得复杂,并且由于硅晶圆的脆弱性会降低产量。此外,长时间暴露在电介质冷却剂中也会损坏芯片,与更换冷板不同,唯一的维修选择是更换芯片。行业专家表示,为了实施微流体技术,它必须成为整个生态系统的标准实践,因为必须仔细管理与生产、可靠性和维护相关的风险。
