IT大嘴巴 · 1月31日 · 云南

盘点2023,关于算力发展的那些事儿

“时间就像一头野驴,跑起来就不停”。

相对于“白驹过隙”的描述,我更喜欢吴敬中这接地气的比喻。诚如斯言,不知不觉间2023年就这么溜走了,而2024年也只剩下了11个月。回首过去这一年,整个IT市场迎来了前所未有的“巨变”,AIGC席卷全球的同时也为中国IT市场带来了创新和机遇,各地如雨后春笋的智算中心建设和以液冷为代表的诸多创新性应用快速普及都说明了这一点。但要想捋清整个行业发展的脉络,还是要从算力发展说起。

算力需求多样化,“一机三芯”多创新

2023年8月,中国算力大会在宁夏银川开幕,会上发布了《中国综合算力指数(2023年)》报告。报告显示,中国算力规模特别是智能算力规模不断提升。截至2023年6月底,中国算力规模达到1.97万亿亿次浮点运算,位居全球第二。其中通用算力规模占比达74%,智能算力规模占比达25%,智能算力规模同比增加60%。

其实不需要看报告,看看我们身边发生的事情就足可以证明这一点。当时间进入2023年,我们听到最多的词就是大模型与AIGC,甚至达到了“凡有井水处,皆谈大模型”的场景。而这其中,出于众所周知的原因,大家对于算力的需求格外迫切,这也让许多算力提供商看到了巨大的市场机遇。

image.png

首先坐不住的就是芯片厂商,2023年包括英特尔、AMD、Ampere在内的众多品牌纷纷发布全新系列处理器,甚至英特尔还在年初与年尾两次更新主打的至强可扩展处理器系列,创造了前所未有的“壮举”,新品更是将AI推理性能提升了42%,更契合行业需求;在AMD方面,多核是核心优势,最高192核心对于通用计算来说优势明显,而在增加了AI处理能力之后,“Zen 4c”核心架构的霄龙处理器在AI能力上也有更多优势。

你方唱罢我登场,每个人都想抓住这个算力风口,而如何将芯片性能转换为最终的算力表现,还需要解决方案提供商的支持。常年占据服务器市场销量冠军的浪潮信息,在23年5月发布全新一代G7算力平台,以创新的系统架构支持Intel、AMD、Ampere三大处理器平台,包括支持x86、ARM等国际国内8种通用处理器和51种加速芯片,是目前业界算力支持最广泛的平台,采用最为先进的计算、存储和互联技术,实现通用、AI、高端等全算力业务场景覆盖。

以其中双路旗舰产品NF5280G7为例,支持最新的Intel、AMD、Ampere三种处理器,实现存储、IO、异构模块随意搭配,能够覆盖从通用计算到异构计算,从存储型到IO型等用户业务场景。同时得益于绿色的设计理念,NF5280G7兼容风冷及液冷散热设计,在保证原有性能的同时进行散热优化,降低散热功耗。

基于Intel最新发布的第五代至强处理器,NF5280G7支持AMX/DSA等AI加速引擎功能,相比上一代平台的内存带宽提升87%、三级缓存容量提升3倍,支持最高的PCIe5.0 IO互连速率,可以大幅降低时延,提升数据访问效率20%-30%,语音和图像识别等应用场景AI推理能力的提升42%以上,在LLaMA27B/13B大模型推理场景中,性能最高可提升至2.7倍。

充分发挥数据价值,高存算比就这么简单

当然,AIGC、大模型带来的不只是算力需求。那么多的数据如何存储、如何应用也是大问题。于是这一年,国家数据局正式揭牌,看名字就知道这是要加强数据管理,让数据有效存储、充分利用、发挥价值,其成立对于我国通过发挥数据要素作用带动经济高质量发展,将起到全局统筹的重要作用。也正是在国家的统一规划下,如今许多省市也有了自己的数据局,数据应用形势一片大好。

当然这个过程不可能一蹴而就。虽然有人将数据称为数字化时代的“石油”,但即便是石油开采也需要蒸馏、催化、脱硫等众多步骤,而数据的使用也同样需要清洗、筛选、训练等多个步骤。有了“数据金山”,但是不能守着金山要饭吃,而是要让金山发挥大价值。

为此,国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》,旨在充分发挥数据要素乘数效应,赋能经济社会发展。而实现这些计划的前提就是先把各领域数据存起来,再结合不同应用场景进行相应处理。

根据应用场景的不同,数据处理包括存算一体和存算分离,在存算一体中又分为批流一体(批量处理、实时计算)、湖仓一体(数据湖、数据仓库)不同情况,各种不同场景对于基础设施而言意味着不同配置需求,有的要求强劲算力,有的要求海量存储,还有的要求高速读写,是否有一台设备能够满足各类数据处理场景呢?

答案是肯定的。为了应对智算时代的大数据存储与应用需求,浪潮信息发布了NF5266G7,其创新性的存储架构为海量数据处理提供了大容量空间,结合超强算力与高网络带宽,能够灵活满足各类大数据应用场景需求。

作为一款2U高密度存储服务器,NF5266G7在高存储密度、超强算力、高网络带宽、智能管理等方面得到大幅提升。比如它创新性的提供了“24+4”的磁盘配置模式,可以支持最大支持28块3.5寸硬盘(前置24后置4);也可以支持24大盘+4NVMe或24大盘+8NVMe (8U.2/8E1.S)方式,满足不同场景的需求。搭配双路至强可扩展处理器,其核心数量最大可达120颗,再加上400Gb低时延网络,实现了更为出色的存算比,满足千万级IOPS需求,同时满足数百TB数据存储,实时分析数据速度最大可提升26%。

运维管理新体验,打造数据中心的智慧大脑

以上我们介绍的都是2023年的算力、存力变化,都是围绕硬件基础设施展开的。但其实除了硬件变革,算力发展也在冲击着原有的运维理念——以前的系统管理员只考虑管理的几十、几百台服务器,但如今动辄几百个P的数据中心有着成千上万的设备,仅依靠人力已经难以实现有效管理,于是整个产业也需要强有力的数字指挥官。

对此,浪潮信息也推出了InManage管理平台的全新版本,并获得了国际权威机构的认可。2023年9月,国际权威研究机构Gartner发布了中国AIOps市场指南报告《Market Guide for AIOps, China》,报告从数据中心运维需求变化、技术影响等角度,为中国的组织和I&O领导在采用或推进AIOps提供了深刻见解和实施建议。其中,浪潮信息InManage作为唯一的一款服务器厂商软件产品,凭借领先的AI能力,以及多个行业数据中心智能化运维的成功经验,获评AIOps标杆。

为什么InManage能够获得如此殊荣?InManage如何让整个数据中心像计算机一样高效运转?InManage又为整个运维行业带来哪些变化呢?这一切都还要从AIOps管理理念说起。面对数据中心的多重运维挑战,AIOps即智能运维已被业界广泛使用。而随着人工智能等技术的不断发展,AIOps也在不断进化之中,特别是大模型的涌现能力为AIOps技术的革新、提高AIOps运维效率提出了更高的要求。

在这种情况下,InManage实现了全新升级。相对于其他同类型产品来说,InManage可以实现对数据中心中基础设施全生命周期资产管理、智能化监控管理、自动化部署管理等全面功能。全新版本的 InManage提供更加广域的纳管能力以及线上线下资产统一管理能力,可以纳管400多种不同品牌不同类型的资产设备。除此之外, InManage目前可以实现10万+和上亿级的监控指标统一分析,快速发现并精准定位故障,故障诊断率超过 98%。可以说,全新升级的InManage已经可以针对数据中心的软硬件资源实现精准算力调配,让用户数据中心更加高效、稳定、可靠。

坚持绿色低碳,走可持续发展之路

有算力、有存力、有管理,更要有可持续发展的未来,这也正是近些年从政府到行业都在强调的绿色低碳概念。2023年,许多城市出台了数据中心PUE限制令,甚至一线城市要求新建数据中心的能耗控制在1.2以下。这个数字对传统风冷散热提出了严峻挑战,甚至可以说是“不可能完成的任务”,因此越来越多的用户也将目光聚焦到了液冷解决方案上来。

作为绿色计算先行者,浪潮信息持续践行“All in液冷”战略,实现服务器全线产品支持冷板式液冷,重点产品支持浸没式部署,围绕部件、节点、整机、数据中心等各层级建立绿色评价体系,牵头重点标准、白皮书编制推广。

以 NF5180G7服务器为例,同样是采用了最新一代的至强可扩展平台,但NF5180G7服务器是唯一可选支持风冷EVAC、冷板式液冷及浸没式液冷三维不同散热模式的机型,整机散热能力提升24%以上,单台设备一年可以节约近千度电力,PUE最低可降至1.1以下。在部件方面,NF5180G7采用“整机3层保护模式”,从物理的硬件冗余、系统的降额设计,到软件的系统保护设计,层层提升产品可靠性,在一个部件出现故障后,冗余部件可以保障系统作业不会中断。

动态Power Capping技术则是NF5180G7的另一项“独门绝技”,它可以提供过载实时响应措施确保系统供电安全,实现主板MTBF无故障工作时间超过25万小时,确保关键业务的连续性。而为了提升稳定性、安全性,NF5180G7还具备了多项硬核技术,比如AMT技术可以实现细粒度的故障筛查和修复;ISQP技术可以防止人为恶意访问和恢复造成的数据泄露风险。从性能到散热再到安全性,NF5180G7实现了面面俱到。

在刚刚过去的2023年,我们开创了一个智能化的新时代,特别是六部门联合印发的《算力基础设施高质量发展行动计划》明确了未来算力发展的使命与方向。随着算力、存力等需求的不断增加,随着全国各地众多数据中心、智算中心的拔地而起,未来整个产业向超高密度、超大规模、绿色低碳方向发展已不可逆转。

这些基于算力、服务于算力的诸多变化,最终也产生的新的算力。就像历史螺旋式向前发展一样,未来的算力乃至于智能化发展也离不开不断的前进与整个行业的共同努力,最终实现千行百业的数字化转型,实现中国经济的高质量发展。

推荐阅读
关注数
1932
内容数
249
专注开放计算、大数据应用、人工智能、企业数字化转型、云计算等领域产业观察及产学研合作。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息