E企研究院 · 2021年08月04日

开放计算迎来十周年 协同创新释放双向价值

过去十年,移动互联网、云服务从起步走向繁荣,超大规模数据中心作为云服务关键支撑力量也备受关注。随着数据中心走向集中化、规模化,IT基础架构在性能、功耗、部署等方面遇到的挑战越来越大。

最开始遇到这个问题的是Facebook,自2009年它开始设计自己的数据中心IT设备,以尽可能低的成本实现超大规模的计算能力。

2011年,Facebook将自己在数据中心的IT设备设计和成果在业界分享,并联合Intel、Rackspace、高盛和Arista Networks发起首个数据中心级开源项目:开放计算项目(OCP)。之后,ODCC、Open19相继成立。
djEvZDl4THZUYmpoTWRnRld3UWpUbGFacV9wdXpueGdOR3l1eDR4YnBDYW1hUDZTeE0yTDZ0bjFKNW0zQW93R01xbXdfVlc2emJjVFI0bzNNYjVKTFdzbGd5V1F0WXltLUNseGxxSDl1TGFSREk9.jpg

OCP中国开放计算峰会(OCP China Day 2021)现场

10年来,开放计算社区逐渐发展、壮大,引导IT产业走向集约高效、绿色节能道路,越来越多的公司也加入到开放生态中,通过IT基础架构在产品、规范、知识产权等成果的共享,加速新技术落地实践,推动绿色高效数据中心建设。

这其实是开放平台下的双向价值体现。

对于产业,它集聚了来自于不同国家、不同文化背景的不同公司,甚至有些公司互为竞争对手,大家打破了边界开展全球产业协作,解决数据中心基础设施可持续发展的重大问题,让更多的创新技术得以普惠。

对于社区和社区成员而言,所有生态伙伴以开放包容的心态,把一些开源的硬件设计共享给大家,社区规模、社区成员类型以及供应链完善等方面,OCP都取得了显著的成长与进步;如今,一些小公司,包括新兴公司,无需从零开始或重走他人的老路,仅需专注于其独有的技术和设计。

开放计算成为创新主力

在OCP中国开放计算峰会上,OCP CTO Bill Carter提出,目前参与社区项目的人数在疫情下仍保持增长,大约有30个项目在同时进行,拥有150多个解决方案,形成了从产品、组件到整机架的供应链体系。

浪潮信息副总裁、浪潮信息AI&HPC产品线总经理刘军也分享了一组数字,目前开放计算社区拥有了250多位成员、超过5000位的工程师。每年基于开放计算标准的服务器部署的数量达到了470万台,今年开放标准的服务器已经为全球的数据中心提供的算力占比达到了34.8%。

djEvdVkwTldwRU80c2kwZk5leE9IXzZMS19wdXpueGdOR3l1eDR4YnBDYW1hTjRpWGxvQnFtWnRwUDFESFdmNzNPd01YdzNha0FKWHNjVHZLWTlMVHI0SERhNVJvekNfempKaFcweGlfVHJzWEU9.jpg
浪潮信息副总裁、浪潮信息AI&HPC产品线总经理刘军

而从分析机构Omdia联合浪潮发布的《全球开放计算发展报告》来看,开放计算是未来IT基础架构创新发展的核心驱动力之一。随着开放生态的发展,未来基于开放标准的基础设施占比将持续增加,2025年全球40%的服务器将基于开放标准。

开放计算成为数据中心创新的主力。

在“双碳”目标下,今年OCP中国开放计算峰会主题是降碳、增效。目前,中国要求新建大型数据中心的PUE值小于1.3,对绿色节能提出了更高的技术需求,比如专门提到需要高密度集成的高效IT设备、支持液冷的高效制冷系统、支持高压直流的高效供电系统等等。开放计算社区创新项目的布局与国家和产业发展目标达成一致,未来十年有了清晰的方向。

其实在数据中心领域,早已拥有多维度的考量,但在低碳转型中,更大规模创新和生态合力更加重要。

开放计算的新生态合力

无论是OCP还是国内的ODCC,基本的价值使命是构筑基于新标准的产业生态,放弃封闭的心态,勇敢的把设计开放出来让大家复制、使用,真正的把生态环境打开,因为一旦有了这个基础,在一个新的生态环境里,就会衍生出更多的市场机会,并远远超出原有的预期。

今年的开放计算峰会一个大变化是:开放计算聚合了更多产业链上下游的领先企业,除了大家很熟悉的Intel、浪潮、腾讯、百度、阿里、电信、中国工商银行等,还有一些专业领域的诸如西部数据、希捷、燧原科技、Edgecore Networks、Vicor等共计23家企业,在这个平台上,他们给开放组织贡献了更多设计,集中展示了开放网络硬件、48V直流供电系统、微模块电源解决方案、存储设备振动控制等方面的新规范新应用。

近年来,中国数据中心建设迎来高速发展期,以平均年30%左右的增速领跑全球,中国的超大规模数据中心呈现高密化、规模化发展特征,如何持续降低数据中心PUE一直备受关注。

djEvZDl4THZUYmpoTWRnRld3UWpUbGFacV9wdXpueGdOR3l1eDR4YnBDYW1hUGs4UC1URE5sM3Z6X3UwZUltWFFtNXhuUnkzZFJjaFV2OFRLN054VmoyVU42ZHB2UUw0RE1XckV6dDdhWWRwTnc9.jpg

这更需要产业链的协同创新,聚合领先的科技企业,以社区的方式推动领先技术的产品化和产业化,实现数据中心绿色高效。目前 OCP社区设立了数据中心基础设施、服务器、网络、存储、硬件管理、机架&电源等九大类23个技术专项。

在绿色节的技术路线中有一个Rack&Power项目子课题,研究采用不同的液冷式(冷板式、浸没式)来降低数据中心的PUE、采用集中供电的技术提高数据中心电源的转化效率,同时在Hardware management的课题里推进Open BMC开源架构,实现数据中心智能节能的管理。

1、液冷

在去年的OCP China Day上,阿里分享了液冷数据中心一体化探索,通过数据中心IT设备冷却一体化设计,大幅提高了数据中心能源使用效率,在支持液冷及绿色节能方面,浪潮全面布局冷板式液冷、浸没式液冷、直流供电、电源负载智能调度等技术,可支持PUE<1.2的大规模数据中心的方案构建。

djEvZDl4THZUYmpoTWRnRld3UWpUbGFacV9wdXpueGdOR3l1eDR4YnBDYW1hTlg0WC12aVBuTl8xZXFoc2RXRXV1ekdVaTAwcnJqVFhYMFVzVnpsWnFweGpGM01wN0NiZVlaZWp0OFVEQ0JtTXM9.jpg

而最新的Open Rack 3.0将采用48V直流电源和液冷技术,机架高度从41OU增加到44OU,进一步提高数据中心的空间利用率,添加GPU等异构加速单元,以满足产业界对加速计算的需求。

2、48V

众所周知,数据中心电力消耗非常大,Vicor公司就是专注于把电源模块赋能于电力系统里面,用模块化把PDN进行优化,用电源模块让电力系统更加有灵活性、扩展性,让数据中心系统有更高的功率密度、还有更高的效率。

djEvZDl4THZUYmpoTWRnRld3UWpUbGFacV9wdXpueGdOR3l1eDR4YnBDYW1hTVJDeHkwdVVVNHUwNUlWR2pCczBScFNqLXk1WHVuT19XamF2dmhwWXpiREZHSnJfMDdfMnVESEktYVl4RGRKbTA9.jpg

现在的服务器系统、数据中心系统电压大都是12V,如果从12V升到48V,电流是原来1/4,功率损失会缩减为原来1/16,数据中心48伏直流供电系统将会带来更少的电缆,更少的器件的拥挤度,更轻的质量,更少的功率损失,还可以让储能的空间减少。

同时如果将12V升到48V,由于电压的升高,数据中心可以用更少的容量让系统的稳定性得到更高提升。

整机柜服务器作为数据中心颗粒,集成了计算、网络、存储以及散热、供电、管理等模块,具有完备的数据中心功能,比如浪潮整机柜SR基于开放标准,采用集中供电、集中散热和集中管理的设计架构,支持48V直流铜排统一供电,和电源负载动态调整技术,具有更高的电源转化效率,更加高效节能。

djEva1Vha3hRXzhsWENnZnhMeXdTajF4YV9wdXpueGdOR3l1eDR4YnBDYW1hUG51SUx2cVJORzZLOXhMOFQ2NDZMU3lKYkFCSXBOWEVtZl9TYmVLbnRkSkdlZjhXR2RaNUpmQVd4dS15TEN6c1U9.jpg
浪潮服务器产品线副总经理陈彦灵

在浪潮服务器产品线副总经理陈彦灵看来,光整机柜的模式相对于传统的服务器能耗就可以降低15%,通过集中供电、集中散热,可能再降低15%,如果采用液冷模式,能耗可能降低30%。

3、OpenRMC

当数据中心的规模越来越大,基础设施的管理,算力的聚合、调度将扮演愈加重要的角色,OCP社区的开放机架管理控制(OpenRMC)工作组致力于智能IT资源管理而生,使最终客户更轻松地管理和维护各类厂商的设备并极大地降低系统管理成本。OpenRMC项目由浪潮牵头,其他贡献者包括Facebook、Microsoft、Google、HPE、Dell、Intel和纬颖等。

如同陈彦灵所说,开放计算是一个底座,通过开放计算这个平台,可以整合更优秀的散热方案、系统方案、电源方案,促进数据中心升级,去达成双碳目标。

开放计算加速创新技术落地

在以前,硬件的制造、设计、规范是每个公司的机密,很少对外分享。

而开放计算的另一大价值是技术创新,为多元化的技术提供基础平台。对浪潮信息首席架构师叶毓睿来说,在开放计算平台下,标准化之外的另外一个特点是模块化,不同层次的不同组件由相应专业的公司来做,这会使得硬件重构更快实现,提升硬件迭代的速度。

djEva1Vha3hRXzhsWENnZnhMeXdTajF4YV9wdXpueGdOR3l1eDR4YnBDYW1hUExJRHJsSFV0ODRNc2Ffak1nU1l2TW44cFhGR3VxNkNldXk3QnNUdUtyUXpPSVdJX2hUU0ZtU095ZG1PbG84OXM9.png
浪潮信息首席架构师叶毓睿

比如在面向智能化的计算挑战中,传统以通用计算为主的CPU很难满足AI的算力需求,因此市场上诞生了诸多设计AI专用芯片的初创型公司,OCP OAI项目组建立了一整套可兼容各类AI加速器的技术标准,解决AI计算基础设施建设中硬件和生态分裂化的重大挑战。

OAM是OAI项目组中进展最为迅速的领域。OAM设计规范定义了计算加速器模块互联形式和通用规范,OAM规范的目标是实现加速器模块的标准化,简化人工智能基础架构设计,缩短面向AI协处理器的开发周期和实现大规模采用。目前,百度、Facebook、微软、浪潮等企业均为该OAI小组成员。

OAI规范经过了多轮的演化,通过社区的力量联合起来团结起来,在一个公共的标准下,全球已经有数十款芯片在遵从 OAM规格的设计,为产业发展助力。

在中国,浪潮开发了支持OAM规范的开放计算系统MX1,这是全球首个支持多家不同型号AI芯片的开放加速系统,目前通过社区的共同努力开放开源,一起建立多元芯片的统一底座,为智算产业化消除发展道路上的瓶颈。

而基于开放计算的发展,数据中心实现了在计算、存储、网络的主要硬件接口规范上的统一,但在固件、管理、云OS层面,不同的企业还是有不同的标准,造成了用户的重复适配并带来安全隐患。

如何在标准化的硬件平台接口基础上构建开源开放的固件系统、云OS系统,从而使整个开放数据中心的基础架构里能够在统一的软件资源平台上运行,提高大规模数据中心多元架构设备业务的适配效率,开放计算正在面向OPENBMC、OPEN BIOS、OPENRMC等方面推进。

如今,开放计算已经凝聚了产业共识和智慧,如同浪潮信息副总裁、浪潮信息AI&HPC产品线总经理刘军所言,未来仍需要继续创新来应对数据中心降碳、适配和多元化的挑战,共建标准,共建生态,携手推动开放计算产业的协同创新。

推荐阅读
关注数
5057
文章数
422
对数据中心、云计算、5G、AIoT 等科技领域的最新技术和应用的信息交流、新产品新技术的引导、技术创新与品牌打造,降低用户对新技术的接受成本
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息