内容来源:2022年11月12日,由边缘计算社区主办的全球边缘计算大会·上海站圆满落幕。我们非常荣幸邀请到了国动集团边缘计算业务负责人肖飒肖总来分享,肖总发表了主题为《打通边缘计算“最后一公里”》精彩演讲。
分享嘉宾:国动集团 肖飒
整理编辑:冬冬
出品:边缘计算社区
为什么我今天会来做这个分享?前面分享的绝大多数都是云服务厂商、应用服务厂商,而我们基础设施服务提供商为什么来参加大会?原因是上一次的全球边缘计算大会之后,我们在线下和很多云服务厂商、应用服务厂商做了多次交流。发现大家普遍有一个痛点,就是边缘算力“最后一公里”的落地问题,大家也普遍不太了解像我们这样的基础设施服务提供商能够提供什么样的帮助。
当然这个问题不在大家,是因为我们这样的基础设施服务提供商,往往是服务于三大运营商的,在座各位接触的机会很少。所以我今天所分享的内容就是基础设施服务提供商如何帮助大家打通边缘计算“最后一公里”。
1、 国动集团介绍
先介绍一下我所在的国动集团。国动集团的定位是“独立的通信铁塔及基础设施服务提供商”。用最简单的数字举例,我们在全国通信铁塔的保有数量是近三万座。三万这个数量,在国内和行业老大中国铁塔集团比起来还是有相当的距离,但是这个数字也足够让国动集团在国内排到第二、在亚洲排到第四、在全球排到第十四名。
从另一个维度来讲,三万这个量级是一个能够覆盖全国的数量。比如说中石化在全国加油站的数量差不多也是三万这个量级。和另外一些数字相比,全国的地级市数量大概是三百多个,我们的铁塔数量与地级市数量差不多是一百比一的比例;全国的县级市数量是三千多个,我们的铁塔数量与县级市数量差不多是十比一的比例。这是我们的第一个核心能力。
从下面这张图可以看到我们的铁塔基本在每个省都有。即便是最西部的新疆、西藏,最北部的黑龙江、内蒙古等地,平均每个省都有一百个以上的铁塔。中东部地区更多,每个省都是几千的量级。
第二个核心能力,国动集团拥有全国范围的通信工程建设和运维能力。刚才所说的三万座铁塔是对这个能力一个比较典型的说明。这三万座铁塔通常是租赁给运营商使用,但运营商并不是每座铁塔都会自己去运维,运营商是把铁塔的运维外包给我们来做。
另外一个维度来讲,国动集团在全国的范围内还代维了约三万公里的传输光缆。熟悉光通信的朋友都知道,光缆每几十公里需要一个光放站,所以这些光放站的运维全部是我们来践行。总结一下,国动是国内最懂光通信的铁塔运营商。这个能力我们稍后讲到边缘计算规划方法的时候可以了解到,懂光通信其实有很大好处。
我们讲铁塔可以助力边缘计算“最后一公里”落地。
2、 铁塔组成要素
首先我们了解一下铁塔由什么样的要素组成。
铁塔第一个也是最核心的要素是点位,这里把“塔”打了括号,因为并不是每个点位都有“塔”,比如在一些高楼上是不需要塔的,所以我们用“点位”这个词。点位从两个层面上面要做到非常地稳固,第一个是商业层面,即:这个塔必须不受到市政、土地使用权或者建筑施工的影响,它必须长久且稳固;第二个是地质层面,即:铁塔从地质条件来讲必须是稳固的,不会受到地质灾害的影响。
铁塔的第二个要素是机房和机柜,这也是必须的。我们通常只能看到铁塔的塔体,但其实每座塔下面都有一个机房和机柜。在郊区或是农村,我们通常机房建得比较多,就是铁塔下面有一个小房子,在市中心我们通常采用机柜的方式。机房和机柜里面部署的是运营商的基站设备。
另外,铁塔的供电、传输、空调这几个条件是必不可少的。再就是安防,我们在很多点位都部署有摄像头,可能还会有水浸传感器、智能门锁这样的安防设备。最后我们还需要智能化运维。因为我们的铁塔是在全国范围内铺开的,塔和塔之间的距离可能会有几十公里甚至上百公里。如果塔站的运维完全靠人跑是不太现实的,所以我们引入了大量的智能化运维理念。比如通过智能电表来和运营商结算电费,还有例如断电告警、智能上报。以上这些加起来就是铁塔的组成要素。
回过头看一下,如果把“铁塔”字样全部遮起来,你会发现这些要素有什么特点?其实这些就是一个IDC的组成要素。所以这也是我们认为铁塔可以承载边缘算力的一个主要原因。
3、 铁塔用途
我们现在也在积极地拓展铁塔的多种用途。
第一种应用是专网覆盖,大家用得比较多,比如图上显示的是一个LORA的基站,我们在全国大量城市都部署了LORA专网,用来解决整个城市的远程抄表问题,也有一些地方用来解决城市的烟感、消防上报的问题。
第二种应用是把多功能摄像头架设在铁塔上,用来解决整个城市的消防、安防问题。
第三种应用是CORS的应用,CORS应用这一两年比较火,它解决的是传统北斗定位需要架设一个地面参考站的问题,每个CORS基站大概覆盖三四十公里的半径。以上这些都是用的铁塔的一个基本元素,就是它的点位。
我们再看一下,既然要用到铁塔的点位,那铁塔的点位是怎么来的。下图是无线网络规划的基本过程。
我们所有的点位得出都经过了这样一个规划过程,业内把它称之为网络规划。我们拿到规划需求的时候首先做需求分析。需求分析需要把所有相关资料收集起来,包括行政区划、人口的经济情况、覆盖目标、网络质量目标、现网话务模型、地理信息数据等。
拿到这些数据之后我们要做两个层面的估算。第一个估算它的覆盖,估算覆盖的时候用到一个工具叫做“链路预算”。第二个是容量估算,我们估算每个用户的平均话务量,乘以总的用户数,来得出这一片区的网络需要用什么样的设备来承载。做了这两个步骤后我们会大概得到站址规划。
拿到站址规划后我们需要到现场进行查勘,考察站址是否具备刚才提到的那些的要素:要有很好的点位、要有电、要有传输、要有空调等等。站址规划确定后我们需要用仿真软件进行业务仿真,把一些模拟用户放到点位上去、放到地图上去,来看他们是否能够得到比较好的服务质量。最终我们会输出参数、输出网络配置、输出网络点位。
我讲这么多的意思是什么呢?就是说我们每一个铁塔的点位实际上都不是“拍脑袋”,不是看见这个地方有块空地就去部署。实际上都是根据我们的用户在哪里、根据我们的业务在哪里去选择的。所以从这个程度上来讲,我们认为铁塔的点位对于边缘算力来讲是一个很好的参考,甚至你可以认为它是一个参考答案。你在铁塔密度高的地方去部署边缘算力,一定是不错的选择。
4、 用户案例
为此,我们做了一个测试,也是一个案例。我们找了一个游戏客户,这个客户的目标用户群是18-28岁的年轻人。他的需求很简单,他希望点位离用户越近越好,让游戏用户的时延体验小于30毫秒,这个指标要求和今天早上很多老师分享讲的是一样的。
他找了六个城市的目标区域,红点就是他给我的位置。这些红点基本上都位于城市郊区,是一些大型的开发区。这些地方基本上都是18-28岁年轻人所聚集的地方。在这种城市郊区,年轻人下了班后不太有时间去逛街,所以最主要的娱乐就是在宿舍里面玩游戏、刷短视频。我们拿到了红点之后在后台对照了塔址,蓝色点位就是我给他的选择。所有蓝色的点位都是在红色点位半径五公里范围内。从我们估算的结果来看,所有点位的网络时延都在五毫秒以内。
接下来你们会问一个问题:网络时延是五毫秒,怎么能保证目标用户的时延是在30毫秒呢?为此我们专门做了一个经验公式,可以给大家分享一下,我们称之为“时延预算”。
整个时延预算由这么三部分组成:第一个是终端时延,第二个是服务器时延,第三个是网络时延。终端时延根据游戏客户给我们的指标,他们基本上能够做到在手机终端上5-6毫秒时延。在服务器端,视频抓取加编码的时延基本可以做到8-10毫秒。我们可以估算一下,如果RTT时延做到30毫秒以内,实际上终端加服务器时延已经占到了13毫秒左右,留给我们的网络时延大概最多也就17毫秒。
我们再看看网络时延是怎么组成的。网络时延通常由四个参数组成。第一个参数是L,L代表光纤总长度。每一百公里的光纤总长度能够引入一毫秒的时延。第二个参数是M,M代表你路径中所有OTN节点和SDH节点的数量。OTN节点引入的时延比较少,大概是0.01毫秒,所以我们以数值大的SDH节点为参考值,我们取的是0.1毫秒/个。第三个参数是N,N代表整条路径中二、三层设备的数量,所谓二、三层设备就是路由器和交换机。路由器、交换机越多,N就越大。每个路由器或交换机引入的时延从1毫秒到10毫秒不等。我们这里取了一个3毫秒。
什么时候会到1毫秒?就是网络利用率特别低的时候。什么时候到10毫秒甚至更大?就是网络利用率最高的时候。最后一个O,代表空口时延。我们都知道5G的空口时延可能小于2毫秒,如果变成4G,空口时延变成20毫秒这个数量级。所以看看这个公式,我们可以发现,真正要把算力部署到用户边缘其实并不完全取决于距离或者光纤的距离。根据这个公式,光纤的距离做到1000公里也不过引入了10毫秒的时延。所以说我们要明确一点:把算力部署到用户边缘主要是为了降低N这个参数,因为距离越长,跨的自治域越多,意味着引入的路由器和交换机的跳数越多。
今天早上我们听到亚马逊云科技的朋友分享,他们用专线加上Outposts能够做到35毫秒的时延,我想他们解决的问题就是这个。他们尽量把N降到最小,但是他用专线、两头全是光纤,所以L再长一点,两头长到500公里、1000公里,时延问题也不是很大。
再看一个案例,这个案例也是我们给这个游戏客户做的一个方案。他希望在全国每个省做算力部署,覆盖整个省级别行政区的用户。
第一种做法我们用单核心部署。熟悉地图的朋友都知道这是湖北,我们把算力部署在武汉核心的IDC里面,这个时候会得到一个覆盖区域,估算下来优质覆盖区的半径大概是50-80公里,占行政区的面积大概15-18%。
第二步,我们做了一点点修改,引入了两个近郊的边缘节点。熟悉武汉地理的朋友都知道,武汉分为武汉三镇。我们把汉阳和武昌沿着三环各找一个边缘节点来部署算力。在汉口的核心节点位置并不改变。这个时候它的优质服务区会明显地扩展,可以占到整个行政区面积的25%-30%。这个变化是怎么引入的?就是因为我们如果把算力部署在汉阳或者是武昌的这种边缘,用户访问服务器的时候,并不需要上到武汉的城域骨干网再跳到它的IDC。这样一来会节省几毫秒到十几毫秒的时延,我们在其他方向上可以更好地提供服务。PPIO的王闻宇先生在前段时间一个交流上面提到类似的观点,他的表述大概是这样子:“如果把边缘算力部署在城域网,时延大概是5毫秒左右;如果把边缘算力部署在城域骨干网,时延大概是15-20毫秒。”区别就在于上到城域骨干网后会因为路由器、SDH设备增加几跳而引入时延。
第三个很简单,就是标准边缘计算的方案。我们把单核心变成了单核心加上远端边缘节点,这个时候我们覆盖了全湖北三个最主要的城市,这样它的优质覆盖区域占到了整个行政区面积的35%-40%。
5、 总结
总结一下所谓的通信基础设施服务提供商可以为边缘计算的“最后一公里”做一些什么事情。
第一,我们有充足的点位供大家选择,即便是行业“老二”,我们在全国也有近三万个点位。
第二,我们提供公立第三方的方案建议,不管你的客户来自三大运营商的哪个运营商,我们都有很好的方案相匹配。
第三,我们有一站式的建设和运维服务,你的运维人员可以像刚才很多云厂商说得那样,坐在办公室直接就可以开通服务,所有现场的施工、安装、调测由我们解决。我们可以提升项目落地的速度。我们做过测算,最快两个星期可以在现场部署一个边缘算力节点,这个是指我们把机架等设施都准备好,你们只要把服务器发到现场,插电接网线就可以提供服务。最后,我们可以显著地降低大家的capex和opex。
好的,我的分享就到这里。谢谢。
作者: 廉士国
来源:边缘计算社区
推荐阅读
注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。
尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!
欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。