详细内容或原文请订阅后点击阅览
保护您的人工智能投资:为什么冷却策略比以往任何时候都重要
数据中心运营商在过时的冷却技术上投入了数百万美元。围绕数据中心冷却的讨论不仅在发生变化——它还被人工智能的经济学完全重新定义。赌注从未如此之高。人工智能的快速发展以很少有人预料到的方式改变了数据中心的经济状况。当一架人工智能服务器的成本为 […]The post 保护您的人工智能投资:为什么冷却策略比以往任何时候都重要首先出现在 Unite.AI 上。
来源:Unite.AI数据中心运营商在过时的冷却技术上投入了数百万美元。围绕数据中心冷却的讨论不仅在发生变化,而且还被人工智能的经济学完全重新定义。赌注从未如此之高。
人工智能的快速发展以很少有人预料到的方式改变了数据中心经济学。当一架人工智能服务器的成本约为 300 万美元(相当于一栋豪宅)时,风险计算发生了根本性变化。正如 Andreessen Horowitz 联合创始人 Ben Horowitz 最近警告的那样,如果不谨慎管理其基础设施战略,为这些大规模硬件投资提供资金的数据中心“可能会很快陷入混乱”。
Ben Horowitz这一新现实要求从根本上重新思考冷却方法。虽然 PUE 和运营成本等传统指标仍然很重要,但它们是保护这些价值数百万美元的硬件投资的次要指标。数据中心运营商应该问的真正问题是:我们如何最好地保护我们的人工智能基础设施投资?
传统冷却的隐藏风险
传统冷却的隐藏风险业界过去一直依赖单相水冷解决方案,在 AI 时代,这种依赖带来的风险越来越令人无法接受。尽管多年来,这种解决方案一直为数据中心提供良好的服务,但 AI 工作负载的热需求已将这项技术推向了实际极限。原因很简单:单相系统需要更高的流速来管理当今的热负荷,从而增加了泄漏和灾难性故障的风险。
这不是一个假设的风险。一次漏水就可能立即摧毁数百万个 AI 硬件 — 在当今供应受限的市场中,这些硬件的更换交付周期通常长达数月。即使是一次灾难性故障的成本也可能超过数据中心全年的冷却基础设施预算。然而,许多运营商继续依赖这些系统,实际上是将他们的 AI 投资押注在老化的技术上。
询问