作者:Hannah Peeler November 29, 2021年11月29日
联合作者:Joshua Randall ,Zach Lasiuk
今年早些时候,联合国气候变化框架公约(UNFCCC)报告称,目前的气候承诺将无法充分限制全球变暖。为了限制全球气温上升1.5摄氏度,我们都需要做更多的工作。Arm已承诺到2030年实现碳净零排放,并正在努力使计算机脱碳,利用低功耗、高性能的基础技术来降低能耗并帮助减少排放。
为了实现这一目标,我和我的团队研究了如何为我们自己和我们的合作伙伴实现计算脱碳,使其超越表面层面。我们的研究是我们参与联合国全球契约青年可持续发展目标创新者计划(YSIP)的一部分。该项目为期10个月,由年轻专业人士组成的团队开发解决方案,为公司带来市场价值,同时推动可持续发展目标的实现。
其结果是一个叫做碳顾问(CA)的工具,它允许用户就其计算工作负载对碳的影响做出明智的决定。通过考虑碳排放以及成本、性能和质量,它可以帮助用户在云提供商、实例类型和计算位置之间进行选择。
数据中心的碳成本
那么,我们为什么要关注数据中心呢?
2010年,数据中心消耗了全球用电量的1%左右。但是,计算用电总量的份额正在向云计算和超级计算转移,效率的提高越来越难实现,需求也在增加。我们需要一种以数据为导向的方法来清晰地了解我们活动的碳成本,这样我们就可以利用这些信息来降低碳排放。
2010年和2018年按数据中心类型划分的估计全球数据用电量。
资料来源:Masanet等人(2020年)。
能源创新:数据中心实际使用了多少能源?重新校准全球数据中心能源使用估算。
重新校准全球数据中心能源使用估算。
资料来源:Masanet、Eric&Shehabi、Arman&Lei、Nuoa&Smith、Sarah&Koomey、Jonathan。(2020).
Science 367984-986. 10.1126/science.aba3758。
在评估如何以最佳方式设计、维护和利用数据中心计算,以及如何最大限度地减少数据中心的温室气体(GHG)排放时,需要考虑以下因素:
电网碳强度
能源使用产生的碳量,通常以克CO表示₂ 相当于每千瓦时的能量。其他温室气体具有相关的全球变暖潜能值(GWP),该值可转换为碳当量。
内含碳排放
建筑材料和设备的制造、运输、安装、维护和处置产生的温室气体排放。
设施空间利用
相对于IT总可用空间,现有IT设备的使用。有效的空间利用可以降低冷却成本,降低总体碳排放。
服务器硬件电源效率
设计数据中心中使用的服务器固有的电源效率。许多因素都会影响这一点,包括处理器类型、工作负载效率和服务器年龄分布。
电力使用效率(PUE)
作为IT负载比率的设施能源开销。高比率表示更高的能源需求,因此效率差距增加了设施的总碳排放量。
这不是一个完整的列表,但它展示了影响数据中心最终碳成本的各种影响。一些影响是在数据中心开发的早期阶段确定的,比如芯片的制造导致了具体的碳排放。其他的只在主动运行期间发挥作用,如电网碳强度。还有各种各样的数据可用性:例如,电网碳强度统计数据通常比实际排放量更容易获得,而且直到最近才尝试在更大的生命周期内进行全面测量的方法。
一个可操作的解决方案必须从某个地方开始。考虑到数据可用性和Arm最有能力发挥的影响(后面将讨论这一主题),我们的团队主要关注应用电网碳强度和服务器硬件电源效率的测量。
碳顾问(Carbon Advisor)
该工具从数据中心用户(每种产品的碳排放量)和提供商(每种产品的性能输出)的角度显示数据视图,并支持最多三种解决方案的比较。通过选择目标工作负载、计算源和类型以及位置等参数,用户可以获得与每个解决方案相关的碳排放明细。通过使用这些信息,用户可以对其资源管理做出更具碳意识的决策,并具有更精细的粒度和对其最终碳影响的充分认识。很少将碳成本视为主要设计决策;碳顾问是实现这一实际考虑的一个步骤。
Arm Carbon Advisor原型的匿名截图
我们的第一项任务是确定每个用户组的不同需求。
定义用户需求
用户希望完成一个设定水平的工作,排放尽可能少的碳。他们可以通过选择云提供商、实例的类型和大小,以及尽可能谨慎地安置资源以限制排放来实现这一目标。以下是他们在此过程中直接或间接控制的因素。
定义提供者需求
提供商的目标是在固定功率(和碳)量的范围内,最大化给定工作负载的总性能/效用。
数据挑战
在将碳减排应用于数据中心时,实现这种级别的透明度和粒度是可行的,但获取可靠和透明的数据是一项挑战。以下示例显示了问题的复杂性:
.电网碳强度:向数据中心供电的碳强度对其最终排放量有着深远的影响。虽然一个城市、州或国家的电网通常有公开的碳指标,但许多云提供商为其数据中心采购可再生能源,这大大降低了其电力的碳强度。这些数字通常很难获得,但对于任何给定的解决方案进行精确计算都是必要的。
.服务器电源消耗:数据中心服务器中使用的不同处理器具有不同的电源消耗要求。热设计功率(TDP)通常用作基准测试和估算的功率消耗指标的代理,但在数据中心环境中,TDP通常不准确。这是由于电源利用率和服务器机架的设计,以及数据中心使用的其他常用方法,如虚拟化。要获得准确的数字,需要在服务器机架环境中进行详细的总体拥有成本(TCO)分析,但这并不总是可能的。
.工作负载性能:在实践中,碳成本将始终与保持适当性能的需要相平衡。然而,进行明智的权衡需要对目标工作负载进行准确的性能估计。有一些常见的工作负载,大多数处理器都有公开的估计值,比如SPEC Integer Rate。但对于许多工作负载来说,这些信息并不容易获得,而且独立确定成本高昂。
当前的数据可用性、准确性和透明度标准限制了对碳指标具体数据的访问。没有这些具体数据,做出明智的碳意识决策是一项艰巨的任务。CA在其计算中明确了警告和假设,但理想的解决方案是利用经过充分审查和透明的数据。这只有通过供应商和用户之间的公开沟通才能实现。为了实现ICT行业乃至全世界更大的可持续性目标,我们需要在整个行业内采取协调一致的合作方式。
https://www.arm.com/sustainability?_ga=2.6395826.1053988969.1638707013-1759771560.1612011439