自2010年起全球互联网流量超15倍增长,数据中心面临能耗挑战

AI世纪 2025-05-08
服务器 2025-05-08

来源 |

链接 |

01

背景介绍

自2010年以来,全球互联网流量增长了超过15倍,其中过去几年增长最为迅猛。对云应用、机器学习、增强现实、自动驾驶汽车、人工智能(AI)和其他应用的需求不断增加、正在推动计算任务向数据中心的快速加速和转移,以至于这种现象被称为第四次工业革命,然而这场革命才刚刚开始。以数据中心为中心的数据革命既令人兴奋又有用,但也带来了可持续性方面的挑战。一般来说,数据中心每平方英尺的能耗是典型商业办公楼的10-50倍。在整个供应商中,数据中心在2020年约占全球电力需求的1.5%(约300太瓦时),预计未来这一数字将上升。应当指出,由于能源效率的提高,数据中心能源使用量的增长速度比数据中心的数量及其所容纳的设备的增长速度慢。基于科学的减排目标倡议(SBTi)表明,为了实现净零和全球升温限制在1.5°C,整个ICT行业必须到2030年(与2015年基准相比)减少42%的温室气体排放量。为了应对这一挑战,信通技术部门应优先考虑减少水、能源和温室气体排放的数据中心设计。

然而,在不了解新技术的总体环境影响的情况下,各组织发现很难规划实现其减排目标的路径。微软承诺到2030年实现碳负和水正。作为实现这一承诺的一部分,微软使用生存周期评估(LCA)系统地分析数据中心的潜在环境影响(温室气体排放、能源和水消耗),并通过设计实现可持续性。当应用于更广泛的数据中心行业时LCAs表明传统的冷却技术可以占数据中心总能源需求的40%。微软已经通过功率使用效率(PUE)将数据中心的冷却和电力调节开销降低到低至1.12。在这里,使用LCA来分析数据中心的三种冷却技术:(1)冷板(2)单相浸没;(3)两相浸没冷却。分析考虑了这些技术对计算基础设施的效率和性能的影响。LCA包括原材料获取、生产、运输、使用和EOL处理,以预先识别和缓解最显著的数据中心价值链影响,并支持有效的温室气体、能源和水减排决策。

02

成果掠影

近日,联合WSP团队提出了一个生存周期评估研究,研究最先进的冷却技术对云基础设施的影响,从虚拟机到服务器架构,数据中心建筑物和电网。生命周期评估对于早期设计决策非常重要,可以提高可持续性成果,同时进行可行性和成本分析;文章讨论构建一个复杂的云生态系统(包括软件、芯片、服务器和数据中心建筑)的生存周期评估,分析不同的先进冷却技术如何与该生态系统互动,并从可持续发展的角度评估每种技术,以提供采用指南。生命周期评估量化了先进冷却方法(如冷板和浸入式冷却)在减少温室气体排放(15-21%)、能源需求(15-20%)和数据中心蓝水消耗(31-52%)方面的效益。这种全面的方法显示了生存周期评估在推动资源密集型技术的可持续创新方面的变革潜力。研究成果以“Using life cycle to drive for cool ”为题发表在《》期刊。

随着云服务需求的增加,数据中心的容量和热缓解策略也必须增加。信息技术(IT)行业受益于摩尔定律(芯片上的晶体管数量以及由此产生的处理能力每两年翻一番)和缩放(在不改变功耗的情况下,每代半导体的单位面积晶体管数量加倍)的效率。然而,摩尔定律和标度的最近放缓意味着,现在提高芯片性能需要更多的功率并产生更多的热量。

此外,图形处理单元(GPU)和中央处理单元(CPU)的功率(以瓦特为单位)和热通量(以每单位面积的瓦特为单位)一直在增加。这一趋势可能会使数据中心的热负荷超过现有空气冷却技术的能力,并由于组件较高的工作温度而导致功率泄漏和效率降低。超过热极限会增加排放,降低时钟频率并降低组件性能。过度的热量也会降低服务器的密度。

03

图文导读

两种形式的液体冷却(冷板冷却和浸入式冷却)可以降低能耗,同时增加计算效率和容量,从而减少温室气体排放和水消耗。最近的研究表明,这些冷却方法还支持超频(以比预期更高的速度运行处理器的过程),因此可以将更多的虚拟机和服务器打包到更小的占用空间内,从而提供效率和云处理优势。

冷板(也称为直接到芯片冷却)是小型热交换模块,配备有微通道以增强传热。它们通常放置在服务器内部的高功率芯片和高密度组件的顶部。冷却液回路流经冷板,将芯片的热量传递到服务器外部。冷板系统的液 - 气传热比范围为 50% 至 80% 或更高。

浸入式冷却涉及将服务器完全浸没在介电流罐中,该储液罐可吸收 100% 产生的热量(图 1)。介电液可增加传热,提高芯片功率和性能 ,并减少功率开销和设备退化(因为它们使风扇变得不必要 22)。浸入式冷却的两种主要类型是单相和两相,具体取决于流体类型和传热模式。单相浸没通过自然或强制对流将热量从硬件传递到流体。泵将流体推入服务器。这些流体通常是碳氢化合物基的,有时是氟化的(但规模比两相浸没的规模小)。两相浸没通过潜热传递将热量从硬件传递到流体:热量在较低温度 (30–50 °C) 下使流体沸腾,流体蒸发并膨胀到冷凝器盘管中,然后重新冷凝成液体。在大多数情况下,两相浸没中使用的流体是氟化液作为主流。

图1:液体冷却技术提供了空气冷却的替代方案。

每种冷却技术都有优点和缺点。冷板部署时对现有风冷数据中心 的干扰较小。但是,安装它们可能很复杂,并且可能仍然需要空气冷却。与两相浸没相比,单相浸入使用更便宜的冷却剂和更简单的TANK,但在芯片级的性能较差。两相浸入可以支持非常高的储罐功率密度 ,但使用多氟烷基物(PFAS),这些物质已受到立法审查且需要复杂的TANK。2023年2月,欧洲化学品管理局提议根据欧洲联盟化学品法规限制全氟辛烷磺酸。对超过10000种物质的拟议限制将影响浸入式冷却以及芯片、冷却器、设备、塑料、灭火剂等产品的制造。对一般冷却流体的潜在风险和风险缓解策略的详细讨论包含在方法。

表1.冷板、单相浸没式和两相浸入式冷却技术的优缺点。

图2. 已经为不同的液体冷却技术构建并测试了概念验证。a、冷板配置符合服务器设计和功能。左侧面板显示了使用空气冷却的通用服务器(顶部)或冷板冷却(底部)。右侧面板显示了使用空气冷却的 GPU 服务器(顶部)和冷板(底部)。b,单相浸没使用水箱(左)浸没服务器。右侧面板显示了部分淹没的服务器。c,两相浸没还依赖于服务器浸入水箱中,而水箱则依赖于制冷剂的沸腾,表现为插入物中的表面湍流。

LCA 研究方法:

采用从摇篮到坟墓的评估方式,涵盖数据中心建筑、使用阶段工作负载、服务器等多方面,包括原材料获取、生产、运输、使用和报废处理等阶段。

数据来源与功能单位:分析设备清单等数据,使用 LCA for (LCA FE)据库等计算环境响数据。以年化虚拟核心单位()作为功能单位,便于比较不同冷却技术。

模型构建:聚合各阶段影响以代表数据中心 15 年生命周期的影响,对不同组件按其寿命建模,如服务器 6 年、支持设备 15 年,最终按寿命年化结果并以总数归一化。

可持续性比较结果

与传统风冷相比,冷板、单相浸没和两相浸没冷却在温室气体排放、能源需求和蓝水消耗方面分别至少可节省 15%、15% 和 31%。使用阶段对环境影响最大,其次是服务器制造阶段的隐含碳。

数据中心采用 100% 可再生能源时,上述三种冷却技术在温室气体排放、能源和蓝水消耗方面的新节省分别至少为 13%、15% 和 50%。从电网电力转换为可再生能源,可大幅降低温室气体排放、能源需求和蓝水消耗。

LCA 对工程设计与法规政策的作用

LCA 能展示不同冷却技术的可持续性权衡,帮助云行业制定环境策略,综合考虑设计决策。选择冷却技术时需考虑环境健康安全、LCA 影响、芯片冷却能力等多方面标准。LCA 可助力评估冷却技术权衡,为法规设计提供参考。如欧盟和美国对 PFAS 的监管将影响两相浸没冷却技术应用,LCA 可计算 PFAS 泄漏影响、帮助降低风险。

LCA 可有效比较不同冷却技术,冷板和浸没冷却技术在减少环境影响方面潜力大。虚拟核心概念有助于简化和改进 LCA 分析。微软将利用研究结果推动冷却和云基础设施创新,希望更多公司借助 LCA 实现可持续发展目标。同时,需完善相关信息数据库,以提高 LCA 的有效性。

图3.生命周期评价用于评估数据中心从开始到结束的整个生命周期的影响。

表2. 模型中包含的数据中心基础设施组件

表3.与ACD相比,三种替代冷却技术(冷板、单相浸没和两相浸没)在数据中心设计和操作方面的差异。

表4.与ACD相比,冷板、单相和两相浸没式数据中心实现的节省

图4. 每年每个Vcore的风冷、冷板、单相浸没和两相浸没数据中心的温室气体排放、总能源需求和蓝水消耗影响。