来源:内容由半导体行业观察(ID:icbank)编译自DCD,谢谢。
随着芯片公司竞相以前所未有的速度生产功能越来越强大的芯片,数据中心提供商还能跟上多久?
Nvidia 的 1kW B200 Blackwell GPU 尚未交到客户手中,但这家半导体巨头已经公布了其继任者:Rubin。
此外,Nvidia 首席执行官黄仁勋似乎对公司最近 3 万亿美元的市值并不满足,他还宣布,公司更新后的路线图将每年推出一个新产品系列。
Nvidia 显然已将目光锁定在巩固其市场主导地位和在 Blackwell GPU 发布前满足客户日益增长的需求上。这让制造商在供应方面难以跟上步伐,证明了这仍然是 Nvidia 的世界,我们都生活在其中。
然而,有传言称,Nvidia 并不是唯一一家将功耗提高到 1kW 及以上的公司。AWS 最近透露,其下一代 Trainium3 芯片可能会消耗类似的电量,而英特尔则被认为正在研发一款功耗可能达到 1.5kW 的芯片。
AMD 首席执行官苏姿丰博士也利用她在台北国际电脑展的主题演讲中同样宣布,该芯片公司每年都会向市场推出一款新产品。
但是,在试图支持不断增长的工作负载时,特别是在生成式人工智能蓬勃发展的背景下,硬件公司是否即将开始超越数据中心基础设施?这种争夺芯片制造王牌的持续竞争会对地球产生什么样的环境影响?
当芯片功率超过 1,000 瓦时,就需要液体冷却。虽然自 20 世纪 60 年代以来,这种技术一直用于冷却计算硬件,但现在我们可能已经接近其技术极限。
虽然单相浸入式液体冷却目前可以达到 1kW 左右 - 刚好与 Nvidia 保持同步,但两相浸入式冷却 - 可用于处理具有更高 TDP 的处理器,这并非没有挑战,因为改造数据中心以支持该技术可能很复杂且成本高昂。
还值得注意的是,距离 Blackwell 发布已有数月,Nvidia 仍未确认其液冷 GB200 DGX SuperPod 的最佳冷却温度。
然而,更令人担忧的是,两相冷却中使用的昂贵介电液体可能含有氟碳化合物或全氟烷基物质 (PFAS),这些合成化学物质也被称为“永久化学物质”。这些物质在释放到环境中时不会分解,因此会随着时间的推移在人或动物体内积聚。
在最近于伦敦举行的一次活动中,HPE 的一位高管表示,其液冷技术目前可以支持 Nvidia 的整个产品组合,但他补充说,必须承认芯片的发展方向只有一个,因此功率限制可能会成为未来的一个限制因素。
因此,目前还不清楚它能在多长时间内跟上 Nvidia 和其他芯片制造商的高速产品路线图。
让问题更加复杂的是,智库 Interface 最近发布的一份报告称,开发化学清洁解决方案或将不含 PFAS 的化学替代品推向市场可能需要数十年时间。同样,Nvidia 计划每年发布一个新系列的 GPU,人们只能假设这些 GPU 的性能会越来越强大。
而令人担忧的不仅仅是我们如何让这些未来的芯片保持凉爽。
随着人工智能工作负载的增加,尽管 1kW 芯片尚未成为数据中心的主流,但据估计,到 2030 年,美国将需要 47GW 的增量电网容量来满足数据中心驱动的负载增长。
另外,同一份 Interface 报告警告称,欧盟希望在《欧盟芯片法案》下推动的半导体制造水平,可能会导致欧洲大陆的工业产生与欧洲化工、钢铁和航空业一样多的温室气体。
Blackwell 芯片的生产已经在台湾顺利进行,采用定制的 4NP TSMC 工艺制造。虽然台积电制定了 2050 年净零排放政策,并已采取措施尝试减少排放,但该公司的电力消耗是迄今为止最大的温室气体排放源。据报道,2023 年,台积电消耗了台湾整个电网的约 6%。
具体来说,这与目前台湾可再生能源发电量占比相同。
虽然台积电并不是台湾过度依赖进口化石燃料的罪魁祸首,但遗憾的是,随着该公司采用能源密集型的极紫外光刻工艺,其能5源消耗和排放量预计会大幅增加。
毫无疑问,高耗电芯片将越来越多地出现在人们的视野中,并且被购买的数量也将越来越大。现在是不是该是芯片公司和数据中心运营商联合起来进行评估的时候了,他们应该考虑一下地球,尤其是他们的数据中心,是否真的已经准备好接受能耗达到 1kW 及以上的硬件了?