脑极体 · 2022年08月02日

是什么,让中国成为一台超级计算机?

2022年7月29日,由工信部与山东省政府主办的首届中国算力大会在济南开幕。在东数西算如火如荼发展的大背景下,各种关于算力的重磅话题在这次大会中轮番登场,热闹非凡。其中,算力网络建设相关议题引发了各界关注。

据了解,“中国算力网”是鹏城实验室在国家有关部委指导下推进的算力网络计划。该计划提出了“像建设电网一样建设国家算力网,像运营互联网一样运营算力网,让用户像用电一样使用算力服务”的发展愿景。算力网络既是对现有网络体系的巨大升级,也是对计算产业与应用边界的颠覆。有人认为,如果中国算力网真正建成,那么整个中国将变成一台全球最大的计算机。无论你在中国何处,都可以像获取水力、电力一样获取源源不断的算力。

1.jpg
当然,想要实现“全国一台计算机”的宏大设想,让东数西算工程成为跨时代的发展支点,还需要解决一系列产业挑战和技术问题。如何确保算力全国性的流动与调用中不损失、不浪费?如何实现全社会范围内的算力投资回报最大化?这就需要有一套完整、先进的技术与产业底座作为算力网络建设的支撑。

综合来看,算力网络IP化是最具产业共识与标准化可行性的升级方案,而云网融合则是确保企业精准应用算力,激活算力价值的核心方案。基于“IPv6+”打造的智能云网,是算力网络建设的底座最优选择。

《旧唐书》:“大厦永固,是栋梁榱桷之全也”。基于“IPv6+”打造的智能云网底座,就从数据中心网络与算力调度网络两方面,支撑起了算力网络大厦的时代栋梁。

大厦将兴:算力网络建设的挑战与需求

东数西算,网络为先。计算全国化调度能够成立的基本前提条件,是网络端可以实现算力不过度浪费损耗,同时算力成本整体可控,而这就需要打造全国性的算力网络。算力网络是一个标准的“木桶效应”体系。从网络架构上来,算力网络需要容纳数据中心网络、传输网、接入网等部分,任何一段网络无法有效负载算力,都将导致整个网络的价值丧失。从技术协作角度看,算力网络高度考验着存、算、网的整体协同。网络能力必须完整发挥出存、算端的能力升级,网络需要配合算力的高效释放、灵活调度,为使用者提供便捷可用的算力资源。

在算力时代,算力是中心,网络是根基。但网络的重要性又导致了算力网络建设过程中的一系列挑战。比如说网络的灵活调度、高度无损,以及运维管理的智能化、网络的节能环保等等。其中非常重要的问题,就是上面所说如何满足算力网络“木桶效应”的特点,进行数据中心网络、网络传输体系、边缘侧网络的整体能力升级,确保算力网络不会有某一处“漏水”导致前功尽弃。
2.jpg

为了实现这一目标,最为可取的方式就是建立统一化、标准化,同时满足一系列算力网络需求的网络底座。而华为基于“IPv6+”创新技术,联合各界伙伴打造的智能云网就符合这一需求。智能云网可以有效实现网络高清无损的需求,同时可以引入IPv6网络灵活配置、方便部署的能力,堪称算力时代的联接底座。建立在云网融合基础上的智能云网,可以实现对算力价值的放大,承载更多应用,并实现算力和网络的相互促进以及全网算力的统筹调配和协同利用。

而在如何解决算力网络“木桶困境”的问题上,智能云网的价值也体现无疑。智能云网可以实现数据中心网络升级和算力传输网络升级的同步进行。两大网络的同步采用智能云网,可以实现数据中心网络的“栋”,与算力传输网络的“梁”彼此支撑,最终实现“全国一台计算机”的大厦崛起。

一栋擎天:数据中心网络架起算力引擎

在中国传统建筑中,“栋”是房屋的主要支撑点,负载着全屋的重量,而数据中心在整个东数西算工程中就承担着这样的作用。而数据中心网络的智能云网升级,也就是算力网络中起到支撑作用的“栋”。

在数据中心当中,有无数台服务器联接起一个庞大的计算集群体系。而服务器联接规模越大,对联接能力的要求也就越高。如果网络联接能力不佳,很有可能造成算力在数据中心中就被无端消耗,不仅难以实现计算集群化的目标,更损失了巨量的能源。比如说,海量服务器之间进行数据互访时,很容易由于流量突发而产生丢包。以RoCE网络为例,0.1%的丢包会导致网络吞吐率下降50%,最终造成算力资源的严重浪费。
3.jpg

因此,数据中心网络要能够实现零丢包、100%释放,可以说是全国性算力网络能够实现的前置条件之一。为此,华为推出了智能无损数据中心网络2.0,可以帮助全国各地的数据中心构建算力时代的网络基石。华为智能无损数据中心网络2.0,面向通用计算、高性能计算、存储等场景全新升级,具备应用加速、高通量、低时延等特点,实现多元算力水平显著提升。华为创新地将智能无损算法引入数据中心网络交换机,攻克了以太网丢包难题。在服务器规模不变的情况下,数据中心内算力最高可提升93%。为了构建超大规模算力集群,华为将直连拓扑和自适应路由引入以太网领域,目前最高可支持27万台服务器的零丢包组网。尤其值得注意的是,华为智能无损数据中心网络2.0能够支持IPv6部署,从而可以实现数据中心网络更调度更加灵活,运维管理更加便利。

算力中心网络的升级,可以有效构筑其算力网络的核心引擎,进而支撑起算力唾手可得的未来图景。

百梁纵横:以智能云网搭建算力运输网络

想要实现算力的灵活高效获取,让算力变成水和电一样的基础设施,就必须要有一张能够将算力输送到千行百业的运输网络。想要让企业像获取电力一样获取算力,像使用网络一样使用云服务,就必须由智能云网来做算力网络的运输通道。这一根根梁,通向着一个个行业,一家家企业,最终实现算力网络的落地部署。

不久之前,华为刚刚发布了智能云网2.0解决方案。智能云网2.0在智能云网1.0的基础上,进行新架构、新体验、新模式、新服务四方面升级。算力网络承载着海量企业成百上千的业务。针对每家企业对算力的需求不同,智能云网中搭载了智能云图算法和基于IPv6+的一系列技术创新,最终可以实现按照业务需求为企业提供最佳调度算力网络路径,实现供需侧的最优资源配置。同时,智能云网还可以通过切片技术将网络划分成不同车道,确保算力高效、及时和准确地送达企业。
4.png

而在边缘侧场景这个“算力网络的最后一公里”,由于边缘侧设备在不断剧增,算力协同难度更大,网络配置挑战更多。需要实现边缘算力和网络的相互感知,最终完成“网络+算力”在边缘的联合优化调度。华为积极探索算力感知路由创新,将网络接入节点根据应用标识对应用进行实时流量调度,从而提升整网算力、存储、网络等资源利用率,为用户提供边缘最优算网服务。

2020年10月,华为首次发布了智能云网解决方案,开启了云网融合的新时代。如今,智能云网已经成为业界共识,被誉为智能时代的“新电网”。截至2022年6月,华为完成了260多张智能云网和40000多个智能云端部署。在智能云网的帮助下,算力网络可以更加高效、准确地完成落地,实现东数西算愿景快速实现。

通过最先进的网络技术与解决方案,帮助实现算力网络升级,正在带来一系列改变,比如说——

把算力变成继水、电之后的又一公共资源,随时通入每家每户,千行百业。

把数字中国变成一台超级计算机,联接东西,纵横南北。

把计算与智能的伟大变革契机,留在这片土地上。

推荐阅读
关注数
6399
内容数
1553
写让你脑洞大开且能看懂的人工智能、流媒体、海外科技
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息