IT大嘴巴 · 2021年08月09日

感悟OCP:开放计算的下一个十年该向何处去

在这个讲颜值的时代,我这样“重量级”的主持人并不多见。

7月27日,我受OCP China Day 2021大会组委会的邀请,作为现场第二演播厅的主持人,与十余位嘉宾用了大概4小时讨论了开放计算发展的过去、现在和未来。虽然时间短暂,但是嘉宾们精彩观点的分享在我心中久久不能忘怀,而如何将嘉宾们的观点逐一呈现出来更成为我苦恼的问题。

在第二天从天津飞乌鲁木齐的航班上,全程近5个小时旅程中我一直在思考这个问题,却始终找不到合适的答案。直到飞机降落前的半小时,当我将目光投向舱外,一下子就被美景所吸引——远处高耸的雪山、脚下绿油油的农田,公路上穿梭的汽车小得像火柴盒,不远处波光粼粼的,则是蔚蓝色的湖泊。

这一切都与我之前、也与大众印象中黄沙漫天的西北地区形成了鲜明的对比。有蓝天有草地、有雪山有湖泊、有沙漠有峡谷,在这片广袤的土地上,不同景色交相辉映,各种色彩变化万千。这才是大自然的鬼斧神工,也体现了原生态的应有之义。正如我苦苦思索的那个问题——对于开放计算来说,有计算、存储、网络、数据中心、软件与应用多种配套,这其中包括了大小不一的众多企业,每家企业都为这个组织贡献者自己的力量。如此也才构成了开放计算的全部生态,正是大家的共同努力,才有了过去十年的发展壮大。

正如美特斯邦威那句著名的广告语——每个人都有自己的舞台。

分层应用场景化,开放计算加速数据应用

刘嘉的舞台就在存储领域。作为希捷科技中国区产品线管理高级经理,他与存储打了多年的交道,对于自家的各种技术更是如数家珍。或许有人会说,在这个大数据的时代,越来越多的人都开始使用闪存,甚至我们自己的手机电脑也都是如此,而希捷这个已经与硬盘“紧紧绑定”的名字,能适应新时代的发展吗?

这个想法不能说不对,但却并不全面。的确,对于个人消费品来说,闪存设备的占比已经大幅度提升,但是在企业级尤其是在动辄以TB为单位的数据中心中,传统的HDD硬盘依然是主流,并且是绝对意义上的主流。据著名分析机构IDC的统计,目前依然有90%的超大规模数据中心和云计算中心的数据存储在机械硬盘,这其中涉及成本、能耗、稳定性与可靠性等多个方面的原因。

image001.jpg

“机械硬盘的TCO更具优势,在总体拥有成本上每TB的价格大概是固态产品的八分之一到六分之一”,刘嘉解释说,“同时对于许多关键业务的应用尤其是一些要求数据长期保存的业务及高工作负载应用中,HDD更具备优势”。同时他还表示,其实HDD最近几年也一直在技术上寻求突破,5年后甚至可以提供50TB容量的硬盘,包括在读写速度上也有明显的提升。“希捷也在努力提升机械硬盘的读写效率,并提供了包括HAMR热辅助磁记录技术和MACH.2双磁臂技术在内的诸多技术,磁道密度也达到了纳米级”。

除此之外,希捷也在积极推动开放计算下存储技术与应用的发展。比如针对业界关注的振动、噪音等问题,希捷加入了 OCP的Storage Group,并与浪潮等服务器厂商携手对现有的磁盘仓位置与设计进行优化,“希捷希望可以与服务器和风扇在有限的空间里面去融合的相处,为大家保存、提取数据的价值做更大的贡献”。

西部数据作为数据存储的领军企业,同样清楚HDD的旺盛的生命力。在OCP China Day 2021的主会场,西部数据公司副总裁兼中国区业务总经理刘钢就明确提到了HDD的快速增长——虽然大众关注的闪存盘在过去一年获得了30%的增长,但是传统HDD硬盘也有25%的提升。不过从业务角度来讲,这些增长多是基于不同场景化的应用,而西部数据则将这些场景对应到了不同分层的数据模型当中。

存储行业对于数据的定义大多分为三类——热数据、温数据和冷数据,但是西部数据在此基础上进一步细化,提出了极热数据和极冷数据的概念,从而将这个“金字塔”叠加到了五层。“其实很难用一种介质来满足客户的不同需求,所以一定要分不同的数据类型,然后用不同的介质和设备去满足。我们之所以做进一步的细分,是因为现在技术的发展让我们有机会做更精细的划分,这样当我们去采用不同设备的时候,我们可以用更高的效率和更低的成本满足用户的需求”,刘钢解释说。

刘钢所强调的另一个终点重点则是NVMe Over Fabric,这也被整个行业视为一种全新的存储解耦技术。以往,存储、计算、网络往往整合在一台服务器中,因此如果希望提升存储容量或者性能,许多时候就需要增加对应的设备,这样不仅仅会造成大量资源的闲置和浪费,对于数据传输效率也会造成影响,毕竟数据与数据之间“相隔太远”。

而NVMe Over Fabric则是通过高速互联网络的方式将存储设备整体从服务器等设备中“分离”出来,使得存储设备得以实现统一的管理和运维。这样一方面用户在想提升容量的时候就不需要采购更多不必要的设备,另一方面这些存储也可以提供给更多的服务器连接使用,无论从成本还是从效率的角度都更适合。

做为系统厂商的浪潮信息,也在积极的拥抱,甚至深度参与硬盘及存储行业的完善,例如,从技术研发部王羽茜得知,浪潮信息是国内唯一参与到OCP Storage的Vibration工作组的公司,从服务器系统级的角度,和硬盘厂商一起深度探索风扇的振动和噪声使硬盘读写性能下降的原因,致力改善机箱振动与硬盘的兼容性。

浪潮信息首席架构师叶毓睿分析了数据中心超大规模所遇到的挑战,并分享了基于超低网络延迟,逐步解耦,未来将走向Data Center as a Computer的趋势。这一趋势可能率先会在存储上落地,浪潮的ZNS SSD是其中的一个体现,另外就是NVMe Over Fabric,浪潮和三星在2020年的OCP全球大会上也做了分享。

多元化时代更强调生态协作 开放计算点亮智慧生活

存算分离一直是最近几年整个行业都在强调的话题,也是IT产业发展的趋势之一。而在解决了存储的问题之后,接下来要解决的就是计算的问题。其实谈到这个问题,许多人第一时间就会想到数据中心成千上万的服务器平台,这些平台一直都负责繁重的计算和处理工作。但是如今,在数字化的大潮下,在5G、物联网等应用的推动下,除了后端数据中心之外,包括在边缘侧、在终端也都提供了相当强大的算力,而多元化的算力也使得我们的应用变得更加多彩。

燧原科技就是国产算力的代表企业之一。相对于传统的计算平台来说,燧原科技从创业之初就瞄准了AI应用领域,而这个领域也更强调场景化的操作。因此,如何满足不同行业、不同应用的算力需求,也就是燧原科技当下业务应用的重点。面向AI应用,燧原科技无论是在训练侧还是在推理侧都提供了解决方案,其应用涉及云端和边缘等领域。

“以OCP为代表的开放计算有很好的包容性,未来10年我希望还能继续保持这种包容性,让更多的公司加入,从而创造更大的市场规模”,燧原科技有限公司系统设计总监江斌介绍说。不仅如此,江斌更强调“开放“的价值,以最新的技术应用落地,真正实现对于大众应用的普惠算力。为此,他也希望开放计算能够营造出更大的商业化市场,成员之间实现“从开放中合作,从竞争中共赢”。

提到计算怎能少了英特尔?作为事实上数据中心应用的最强者和开放计算的积极推动者,英特尔一直在努力提升计算效率,无论这个计算是在数据中心还是在边缘侧。也就在7月27日大会的当天,身处大洋彼岸的英特尔CEO帕特·基辛格宣布了未来5年及更远的工艺演进路线,这也意味着英特尔始终坚持在技术的道路上,并希望通过技术变革引领数字化的发展。

这也是领军者的使命及责任。其实说到开放计算,早在OCP和ODCC组织成立之初,英特尔就是主要的发起者和参与者,并在标准的制定和项目的规划方案进行了很多努力。同时,为了响应“碳达峰”、“碳中和”的承诺大势,英特尔也在降低处理器乃至服务器能耗上进行了许多的工作。

“首先,我们在CPU以及其他芯片的架构设计上,追求的是性能与TCO的最佳适配,尽可能帮助客户降低整体拥有成本,节能增效;其次,我们也通过软件控制的方式优化芯片能耗,包括可以根据客户不同的应用需求开启不同的核心、定制不同的能耗;最后,英特尔还有内存分层和傲腾持久内存等领先的产品和技术,可以帮助客户降低对于传统存储设备的需求,也能够降低能耗”,英特尔数据中心平台事业部首席工程师/高级平台架构师龚海峰表示。

事实上英特尔在提升算力这个领域一直走在前列,芯片架构也是英特尔六大支柱之一。在当下云边协同的应用环境下,英特尔不仅积极布局数据中心市场,还在边缘侧做出了众多贡献。“相比数据中心,边缘计算的算力需求是不同的,有高中低的差异化。结合不同的业务需求,不同的系统架构,英特尔也可以提供不同的算力支持”,英特尔数据中心平台事业部高级平台架构师张骏表示。

且不说英特尔的AI计算与FPGA领域的布局,仅针对x86架构来说,英特尔至强可扩展处理器家族就提供了诸多的型号,比如大家熟悉的至强铂金处理器、金牌处理器可以应用在数据中心的强大算力需求中,而类似于至强D处理器平台则可以面对边缘侧的需求,包括浪潮也有一些基于至强D平台的边缘服务器产品。

展望未来,开放计算应该是更加包容、更加平等,也必将吸引更多品牌参与其中。特别是对于中国市场来说,OCP进入中国以来,一直在推动中国数据中心标准化、模块化的发展,而越来越多中国企业的加入,也将对OCP乃至整个开放计算产生正向的推动作用。

在谈到中国市场与中国用户价值的时候,龚海峰特别表示:“我们应该更加积极的参与其中,使得我们的声音能够让整个业界都能听到,也将推动整个业界的协作,把我们的需求变成标准,才能够真正做到中国制造和中国创造”。

从边缘到核心,浪潮用开放计算全力布局数字时代

说到中国数据中心的发展,就不能不提到服务器市场占有率排名第一的浪潮,它是中国开放计算技术实践的先行者,深度参与和主导了中国部分开放计算项目的探索、形成、发展全过程,早于天蝎组织研发整机柜。作为OCP、ODCC等全球开放计算组织的核心成员,浪潮已形成包括计算、网络、存储等开放硬件平台,以及云、大数据、人工智能等软件平台在内的一体化开放基础设施。

“边缘计算目前面临4大痛点,首先是接口和标准的统一问题,因为之前许多工业场景的设备都是孤立的,因此会造成连接上的问题;其次是要实现从底层到上层,从边缘到云端的数据打通,这就需要强大的网络支持,支持数据的高速传输;第三则是数据的应用问题,比如在智能交通中,如何实现数据应用的融合与创新。最后,在进行数据融合与分析后,还需要应用场景的落地,将项目工程变成产品化交付”。在谈到边缘计算应用痛点的时候,浪潮边缘计算事业部总经理孙波可谓是如数家珍。

当然这并不仅仅是浪潮单独面对的难题,而是整个产业都需要面对的问题,这也同时暴露出边缘计算场景下的应用难题。不过也正是看到了全产业的需求,浪潮从一开始就积极团结产业链上下游的力量,不断通过生态的打通让自身的解决方案变得更加完善,也在努力与合作伙伴一同推动边缘侧的开放计算发展。

“其实浪潮一直在围绕这几个痛点在思考,也在去规划我们的产品,去想办法能够把这些痛点去打通,让计算能够更好、更快、更便捷的落地到我们的边缘现场”,孙波笑着说。

从存储、算力到服务器设计,开放计算带来了巨大的改变,也由此推动了数据中心的变革。以往,我们在谈到数据中心的时候总会面临诸多的标准,特别是在机柜尺寸、散热能力、承重效果乃至于管理运维等多个方面都存在差异化。而在开放计算逐步被业界所接受之后,整个业界越来越趋于统一的标准,这自然也带来了数据中心市场的变革。

数据中心市场则一直是浪潮的“主战场”,而提到这个领域大家最先想到的就是整机柜服务器。曾几何时,整机柜还是个“稀罕物”,许多厂商也在不断尝试之后迫于巨大的成本和研发挑战而放弃。但是对于浪潮来说,正因为瞄准了开放计算这一领域,看好其未来的发展,所以从始至终浪潮一直牢牢把握开放计算发展的主旋律,并积极践行和贡献自己的力量。

除了成本之外,能耗一直是整机柜关注的重点,尤其是对于日益增长的应用需求来说,从芯片、存储、网络等各个方面都产生了高能耗的需求,开放计算所要实现的不仅仅是更快速的计算,还有更节能、更低碳的应用场景。

为此,包括OCP在内的整个开放计算组织都在积极努力,包括数据中心基础设施提供商也寻求新技术的支持。“朝亚是第一个在国内做OCP的数据中心,我们也希望在国内有更多的数据中心也获得OCP的认证,这样会给整个基础设施行业带来共享资源,提供灵活的空间,利用现有的服务器的能力实现节能,这是将来OCP可能对这个行业的指导作用”,在谈到OCP乃至开放计算为行业带来的价值时,朝亚数据中心运营副总裁艾宏伟介绍说。

相比之下,另一家数据中心供应商Vicor更看重开放技术为行业带来的推动力。“早在十多年前,Vicor就一直在推动48伏的解决方案,我们也很高兴看到OCP也开始支持这一方案”。从边缘到云端,从自动驾驶到AI,Vicor也在努力推动整个生态的发展,“OCP的方向也可能是Vicor一直在推动的方向“,Vicor数据中心业务总经理陈新军介绍说。

除了提升供电与用电效率之外,更好的方式就是采用全新的散热方案——相对于传统风冷来说,散热效果更好的液冷平台最近几年赢得了行业的众多关注与支持。针对这种趋势,浪潮也推出了包括冷板式和浸没式不同应用场景的液冷解决方案。“以往我们在进行服务器散热设计的时候并没有考虑服务器本身热源的分布,甚至把高热源全部放在一个服务器的底部,把低热源放到上部。而在液冷环境中,我们能够让液体冲流的时候先从高功耗的部件上流过,然后再给低热流的芯片散热……才能创造最好的散热效果”,在谈到液冷带来的应用挑战时,浪潮AI&HPC产品线副总经理赵帅介绍说。

当然这只是服务器众多设计细节的一部分,类似这样的调整浪潮服务器进行了很多。不过在谈到开放计算带来的优势和感触时,赵帅更是直接谈到了“标准化”。在他看来,原本服务器内部许多部件都来自于不同的供应商,相互之间不能兼容,标准也不统一,“液冷的快接头和冷板的标准完全不同”。但是在加入OCP“大家庭”之后,所有成员都必须遵循统一的标准进行生产和制造,这样无疑会大大提升硬件的兼容性,同时对于成本控制也有好处,对于用户来说在后续的应用上也能获得更好的体验。

从研发到应用,开放计算让巨头们开启“多角色扮演”

当然,无论是技术标准的推动还是生态环境的建设,都离不开合作伙伴的支持,这也是OCP能够在开放计算中脱颖而出的关键。作为开放、开源的技术社区OCP也特别注重用户体验,并协同更多用户进行基于场景化的改进与实践。就国内来说,百度、阿里、腾讯等众多互联网大厂都是它的用户,而几大运营商也早已经参与其中,这些大型客户为OCP带来了宝贵的应用经验,也推动着OCP的成长。

同样是在液冷应用上,阿里巴巴一直走在行业的前列。2020年9月,全球规模最大的全浸没式液冷数据中心、阿里巴巴在杭州的首座云计算数据中心——阿里巴巴浙江云计算仁和数据中心正式在余杭落成揭幕,它也是中国首座绿色等级达5A级的液冷数据中心。“我们这个中心每年可以节省7000万度的电能,所以能够很好地降低碳排放,给国家的双碳战略做出一定的贡献”,阿里云服务器资深架构师钟杨帆介绍说。

image002.jpg

说到浸没式液冷,许多人可能对这项技术非常好奇——泡在“水里”的服务器,这消息听起来就让人感觉振奋。当然在仁和数据中心,阿里巴巴基于单相浸没液冷技术,利用绝缘冷却液实现高效散热,无需风扇、空调、冷机等冷却设施,也使得整个数据中心的PUE低至1.09,达到目前世界领先水平;这也使得数据中心的散热不再依赖气象条件,密封的箱体也能保护IT设备免于外界环境的影响,极大提高设备可靠性。

“阿里巴巴很早就加入了OCP,通过大家共同开源,一起努力做得更好……可以去共享它,众人拾柴火焰高”,在谈到开放计算为数据中心乃至于整个行业带来的价值时,钟杨帆如是说。相对于阿里巴巴在底层架构的投入,腾讯也同样在服务器、交换机、开放网络等开放计算领域做出了自己的贡献。不过最近几年,伴随着应用场景越来越丰富,腾讯也开始在应用侧积极布局。

针对物联网和5G应用的大众化,腾讯推出了Mini T-block的边缘数据中心解决方案和AIOT边缘网关+IECP物联网边缘计算平台软硬一体产品方案。前者可以满足类似于游戏、直播、工业等大算力场景的需求,而后者则更多通过云-边协同的统一管理方式,满足于物联网场景的多样性、分布式的物联网场景的需求。“未来我们会有更多的合作伙伴一起参与进来,加入到OCP组织里,更好地实现业务的协同和技术的协同”,在谈到对于OCP的贡献及未来发展时,腾讯科技(北京)有限公司AIoT技术专家袁华勇介绍说。

无论阿里巴巴还是腾讯,它们的身份都很特殊——既作为超大体量的用户具备了众多的应用场景,同时又作为技术解决方案的提供商为开放计算提供技术支持与创新,这与之前我们介绍到的希捷、浪潮等许多案例都不尽相同,也体现出了互联网行业自身的特点。其实不仅仅是互联网,运营商在开放计算中扮演的角色也是非常复杂。

“中国电信集团和研究院目前对于科技研发的重视程度是历史上前所未有的,研究院AI研发中心自主研发了CTPAI 青狮人工智能赋能平台,该平台相比通用AI平台强化了若干针对运营商大型资源池的独特功能。当前我们正在致力于解决模型与异构AI芯片的统一适配问题,同时我们还在研究基于无损网络的高性能全闪分布式存储”,中国电信研究院AI研发中心赋能平台团队总监赵继壮介绍说。而在这个过程中,OCP所扮演的更多是一个开源、开放性的平台角色,也吸引更多的从业者深入其中,让中国电信能够与更多的行业伙伴共同探讨技术与应用的发展。

回首过去十年,我们经历了太多的变化,从最早的现金支付到现在的微信扫码,从以前的电话预约到如今的网上订餐,从面对面的交流到如今随时随地的在线视频……整个互联网在最近10年改变了我们的生活,这背后开放计算也在进行着持续不懈的努力和推动。正是得益于开放计算的支持,我们的计算、存储、通信、数据中心等诸多应用领域都迎来了巨变,我们也在应用上彻底成为了世界的领先者。

展望未来,开放计算的任务还远未完成。伴随着数字化应用的展开,伴随着5G、物联网、人工智能等应用的不断深化,整个IT产业乃至于整个社会都将呈现出数字化的特性,而开放计算能够实现的就是为这种变化提供标准化的、模块化的标准与平台,使得未来的变化有章可循、有条不紊。

或许在过去10年,你没有赶上开放计算的春风;那么从现在开始,你一定不能再错过这波浪潮。开放计算一定会蓬勃发展,数字化生活也一定会早日到来。

推荐阅读
关注数
1943
内容数
252
专注开放计算、大数据应用、人工智能、企业数字化转型、云计算等领域产业观察及产学研合作。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息