软硬件融合 · 5月22日

算力模式创新:亚马逊AWS比作Intel,算力界呼唤台积电和NVIDIA

编者按

半个世纪以前,芯片行业只有IDM模式,芯片公司自己设计、制造并封装芯片,典型的公司如Intel、未拆分前的AMD、TI等公司。

1987年,台积电TSMC成立。台积电定位芯片制造,并不涉及芯片设计。从此,芯片行业产生了分工,IDM分为了两类企业:芯片设计企业(Fabless,如NVIDIA、拆分后的AMD、高通、博通、Marvell、华为海思等)专注于芯片设计,不涉及芯片制造;而芯片制造厂(Foundry,如台积电、中芯国际、AMD拆分出来的Global-Foundry等)不设计自己的芯片,仅做芯片制造代工。

随着半导体工艺进入20nm以下,越来越高的研发成本,让IDM公司难以招架(IDM仅面向一家企业,无法摊薄高昂的成本)。Intel自己工厂的制造工艺严重落后台积电,拖累了Intel CPU的研发节奏,从而导致了AMD的重新崛起。而AMD从低谷到重新崛起,做的最正确的事情,则是拆分了芯片制造部分,成为一家Fabless公司,轻装上阵;同时赶上了台积电先进工艺的爆发,使得AMD CPU性能全面超越Intel。

类似的事情,在云计算行业也逐渐发生。

云计算行业巨擘亚马逊AWS,不仅仅有自己的IaaS、PaaS甚至SaaS服务,还自建IDC、自研芯片、自研硬件,几乎无所不包。但随着云计算行业快速发展20年,云计算的许多技术逐渐走向了成熟稳定,云计算的模式也越来越重。最近几年,国内外逐渐兴起算力网(不一定叫这个名称,但业务模式和业务分工类似)新模式。类似于IDM到Foundry和Fabless的拆分,算力产业从云计算的综合模式,走向了分工的算力中心(负责算力提供)+算力网(聚焦业务落地)模式。

今天这篇文章,我们探讨一下,从云计算到算力中心+算力网的模式创新。

1 分工是行业发展的必然之路

1.1 从系统的视角

一个系统,由多个组成部分(或称为模块)组成。当系统越来越庞大,各个组成部分也越来越大,组成部分之间的交互(接口)也越来越复杂。于是,我们需要把系统进行一定程度的重构:规范且准确的定义每个组成部分的功能,规范组成部分对外的交互和接口。于是,系统变成了一个宏系统,而原来的单个组成部分,已经成为了一个独立的系统(具有了作为独立系统的各种特征)。

我们回到张忠谋当年创办台积电的时候,当时一个很重要的背景是:想创办一家IDM芯片公司,已经成为一个高门槛的事情。所以,才有了台积电,使得有创新想法的团队可以低门槛的开始芯片创业,设计并实现自己创新的芯片产品(Fabless),NVIDIA、高通、Marvell等公司都是在这之后兴起的知名Fabless公司。

这一时期,可以看做Foundry+Fabless模式的起始期,而此时IDM模式仍然有其优势的地方:以Intel为例,它可以做到从芯片设计、定制电路设计、晶体管级等全技术栈优化,从而实现最优的芯片产品,从而达成绝对的市场地位。绝对的市场地位,反过来,又促进其在设计和制造方面的创新投入。

量变逐渐走向质变,真正使得IDM模式变得难以为继是从工艺进入20nm之后。随着半导体工艺逐渐接近物理极限,升级工艺需要持续不断的天量研发投入。台积电可以通过服务诸多芯片公司摊销研发成本,而Intel只能服务自己,天量研发投入难以摊销。半导体工艺的天量研发投入,使得台积电Foundry模式,相比Intel IDM模式,的优势完整显现出来。   

1.2 从开放和封闭的视角

开放和封闭,没有对错,只是商业和业务模式的选择而已。或者说,有人走封闭之路,必然有人走开放之路;反过来,有人走开放之路,就必然有人走封闭之路。

乔布斯发明了智能手机,iPhone的火爆,也使得iOS成为唯一的智能手机操作系统。谷歌要想与之一战,安卓只有一条路可以走——开源。安卓开源的方式,汇集了全球众多手机厂商,大家形成了一个开放的安卓智能手机生态产业。之后,安卓占据了智能手机操作系统的绝大部分市场份额,但苹果收获了绝大部分行业利润。

在CPU领域,x86架构长期一家独大。Intel是相对封闭的模式,于是,通过开放的CPU架构和IP授权模式,成就了ARM的成功。但2016年软银收购ARM,ARM逐渐走向了相对封闭的模式。于是,RISCv迎来了大发展。预计,未来在CPU处理器架构方面,会形成三足鼎立之势:封闭的x86模式、半开放的ARM模式和完全开放的RISCv模式,三个架构、三种模式长期共存。

1.3 从技术和产业的视角

大家经常聊起的一个话题:云计算公司自研芯片。我们可以从产业链上下游的角度来分析这个现象。普遍的观点认为,云计算公司需要向上下游拓展,希望能够做更多的技术创新,能够给客户更多的价值。但这个看法还不够深入。更深层的分析,云计算行业发展很快(有许多创新的想法需要合适的芯片来支撑,有很多强大的产品服务需要客户能广泛使用),快到供应商没有合适的产品供应,快到客户无法把先进的云服务发挥价值(一个典型案例是5G发展这么多年,一直没有出现合适的应用能充分利用5G的价值)。于是,云计算公司没有办法,只能自己(主动或被动的)向上下游扩展,来尽可能的发挥自身产品和服务的价值。

当然,如果有创新的芯片供应商能够开发出更好的芯片产品,让云计算公司自研的产品毫无竞争力可言;如果有创新的业务应用客户,能够充分发挥云计算创新产品和服务的价值;那么,也就不存在云计算向上下游拓展的机会。

一个技术和产业发展的早期,必然是相对封闭的模式。技术公司面对的“一穷二白”的现状,必须“自力更生”,向上游拓展,向下游拓展,从而走向相对封闭的模式。

而一个技术和产业发展的成熟期,必然是相对开放的模式。因为“术业有专攻”,每个企业有自己的核心竞争力,有企业能力的边界,并形成动态的平衡。边界之内,竞争力强;边界之外,竞争力差。从全行业的角度,会形成产业分工、行业协作的开放状态。

2 算力中心和算力网

天下大势,分分合合。

目前,云计算发展了接近20年,已经从一个新兴的产业变成了一个成熟的产业。行业逐渐从云计算的综合封闭模式,走向算力中心+算力网的分工开放模式。

算力中心 + 算力网 = 云计算

2.1 算力网络三方

image.png

云计算模式下,算力供应和算力运营是一体的。但在算力中心+算力网模式下,两者是分开的,算力中心和算力网各自的定位不同,竞争力也不同。我们可以按照电商模式来分析算力网络三方,像电商的卖家、平台、买家三方关系一样:

  1. 算力中心,算力的供应方,卖家。算力中心的核心竞争力在于通过软硬件整合,给用户提供更低成本的算力。会涉及到计算软硬件的协同优化,以及核心IaaS服务。同时,需要考虑市场和销售,对接各大算力运营公司,以及直接对接业务大客户。
  2. 算力网,算力运营方,或者称为算力平台公司。算力运营公司需要海量的低成本算力接入;需要充分利用算力资源,压榨算力的价值。算力网公司,不涉及IDC,不涉及服务器和交换机等计算的硬件,轻量化运营,需要涉及IaaS、PaaS和SaaS服务。需要对行业和业务有深层次理解,能够帮助客户业务场景落地。
  3. 业务客户,算力的需求方,买家。需要①海量、②优质、③多样、④低成本的算力,来支撑自己的业务。

如下表所示,我们也可以类似IDM到Foundry和Fabless的模式转变,来分析一下从云计算模式到算力中心+算力网的模式转变。

表:芯片业务模式和云计算业务模式的类比

image.png

2.2 “东数西算”国家大战略

image.png

东数西算是国家大战略,目标是建成全国一体化算力网。西部建设超大规模算力中心,东部建设更靠近客户靠近业务的算力网。

东数西算是国家东西部协同发展的伟大创举:

  • 在西部,把低成本的资源做高附加值的深加工(从能源到电力再到算力),可让西部获取更多的收益。
  • 在东部,更靠近业务,在当地缺乏能源和算力资源的情况下,导入海量的低成本的西部算力,助力东部当地的经济更快更好发展。

行业从云计算模式向算力中心+算力网模式的转变,非常好的契合了东数西算的国家大战略:

  • 因为靠近业务,传统云计算模式下,在东部建设了大量的小规模数据中心,效率相对较低、而成本较高。未来,配合东数西算,在西部建设超大规模的数据中心/算力中心,更高的效率,更低的成本。
  • 东数+西算。云计算拆分成算力中心和算力网,算力中心在西部,算力运营(算力网)在东部。   

(正文完) 

作者:Chaobowx
来源:软硬件融合

相关文章推荐

更多软硬件技术干货请关注软硬件融合专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。
推荐阅读
关注数
2807
内容数
108
软硬件融合
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息