GPU战火重燃,这次的主角却是华为。
在高端芯片四剑客——GPU、CPU、FPGA、DSP中,如果说后三者国内已有一些公司在前仆后继攻关的话,那么GPU就是绝对的“冷门”,国内能自主研发GPU的厂商可谓寥寥无几。但随着高性能计算以及AI市场的发展,叠加国产化替代的潮流,GPU或迎来“破局”,特别是在华为秣兵厉马踏上征程之后,GPU会发生新的反转吗?
变局
细究GPU市场发展的脉络,是从配角走向主角并持续大放异彩的历程。
随着技术的进阶以及应用的拓展,GPU体系日益庞杂,按接入类型可分为集成GPU和独立GPU,以应用来区分则有PC GPU、移动GPU和服务器GPU三类。在PC显卡发展史中,GPU成为其核心;AI和高性能计算(HPC)的兴起,则让嵌入式GPU和服务器GPU在端侧和云侧找到用武之地。
独立GPU市场双雄争霸。NVIDIA(英伟达)可谓是璀璨的明星,在相继将3Dfx和S3 Graphics这些昔日的霸主抛在身后之后,剩下的对手唯有ATI,直到2006年AMD成功以54 亿美元的巨资收购ATI。此后,双方各自攻城略地,在独立GPU市场奠定了英伟达和AMD两大巨头称雄的格局。在集成GPU领域,英特尔牢牢占据C位。
而在智能手机以及平板移动GPU领域,则是群雄并起。从IP来看,Arm的GPU核Mali在“富爸爸”Arm的帮助下攻城略地;Imagination的PowerVR影响甚大,甚至重新拿回了苹果的订单;芯原微电子在前几年收购美国嵌入式GPU设计商图芯之后亦有不少授权用户;高通的Adreno架构则是通过和AMD合作而构建起来的。从芯片产品上来看,英特尔、苹果、高通、瑞萨、三星、Marvell、华为海思、联发科、展讯、瑞芯微、全志等都在全力耕耘;NVIDIA和AMD的显卡在便携机(notebook)中也有应用,比如“游戏本”。
伴随着AI的飞速发展,GPU显现出强大的算力优势,同时随着可编程环境的友好,成为新晋“网红”。预计在全球AI芯片中,GPU可占据市场的1/3左右。而且GPU在HPC领域历来是重兵驻扎,随着HPC市场正与AI加速融合,GPU正在重新定义超算市场。
世易时移,以往固有格局也在产生微妙的“裂缝”。英特尔计划重返独立GPU战场,并推出了首款Xe架构的通用GPU,基于7nm工艺,应用涵盖了超级本到PC再到AI以及HPC等场景。同时,国内亦迎来新的重磅玩家华为,华为正在韩国设立一个属于Cloud&AI BG的新部门,作为华为智能计算战略的承载者之一,以GPU为敲门砖。
与之相对的是,NVIDIA最近收购Mellanox获得通过,加上之前已将Titan IC纳入囊中,随着英伟达的接连出招,攻防之势将走向何方?
入局
无论如何,国内看起来是“赶了晚集”,回溯过往是为了更好厘清当下,为何做GPU的寥寥无几?
GPU行业资深人士陆安(化名)剖析这与大势相关,CPU命系信息安全,国家重视、政策支持、经费引导,辅以权威人士的呼吁,陈陈相因之下因而众多厂商争相进入这一市场。经过多年的发展,与国外CPU相比差距在进一步缩短。但对同为PC中重要部件的GPU,却明显重视程度不足,而且基础性研究难度大、周期长。
科技老兵戴辉也分析说,国内少有GPU厂商的原因在于,对于新来者而言,GPU难有好的商业模式,市场已基本被巨头垄断。同时,生态难以建立。以PC端举例,两大厂商的显卡与游戏厂商合作紧密,优化效果显著,新进入者很难有机会破局。华为自己也曾有过教训,麒麟芯片前身K3V2 曾使用Vivante的GPU,当时就与一部分游戏的兼容性不好。
对于华为的入局,戴辉认为华为的考量在于:在AI领域,华为自研的达芬奇架构不仅用于云侧,也用于端侧如手机和摄像头等,并实现云端协同,那么华为自研GPU也同样有类似的逻辑,即在云和端协同使用。
这也顺应了目前呈现的技术革命契机和商业模式变化,戴辉的解读具体而微。
一是5G的一大核心场景就是云游戏,游戏在云端运行,通过5G投影到手机、便携机、电视、VR/AR/MR头显等终端屏幕上,这样本地就不需要多少处理能力和内存了。而云游戏将大大撑大对5G管道的需求,就像当年IPTV对宽带的推动一样。而云端GPU的市场价格很贵,成为云游戏推广的最大瓶颈。因云游戏使用的GPU是在云端集中部署的,需要集中采购,而不像传统游戏玩家分散采购,这使得华为这样善于2B业务的GPU新来者有了“可乘之机”。
虽然对于华为自研GPU,业界第一会想到手机GPU,但这一场景要求对各种游戏和应用有广泛的兼容性,要一步到位做好还是不容易的。华为麒麟芯片目前采用基于ARM旗下Mali的GPU IP,未来如何请让我们拭目以待。值得一提的是,苹果2017年开始自研GPU,但目前又重新与Imagination进行技术合作。
但云端的应用不同,兼容一款游戏(尤其是端游等GPU重度应用场景)就可以专门用在这一款游戏上,兼容一款应用也可以专门用在这一应用上,使得市场进入的门槛大大地降低,这很适合华为这样2B能力很强的公司。实际上,华为的ARM服务器CPU鲲鹏芯片就是通过在云端适配特定应用来进入市场的,比如鲲鹏适配了金蝶的云ERP应用,就可以搞一堆用鲲鹏的服务器用于金蝶的云ERP SAAS,而不需要对所有应用都兼容。注意,所有应用是对英特尔都兼容的。云计算的兴起,催生了商业模式的巨大变化,这也为新来者如华为提供了新的契机。
二则GPU在高性能计算中有很大价值,诸多应用如勘测、气象、仿真等都需要大量的数据计算,能实现自主可控的高性能计算,对中国来说是很有安全意义的,这点不言自明。
三则在AI领域应用,华为虽有自研的达芬奇架构的AI芯片,但GPU在一些特定场景的优势也很明显,尤其是在无人驾驶等领域。要知道,AMD的GPU也就是在AI的发展过程中再次崛起的。
四则云端的GPU要和云计算紧密结合,目前英伟达等公司也起步不久,对KVM(国内自主可控云都基于此技术)的虚拟化引擎支持还做得不够,华为的机会窗口还开着。对于华为的5G+ABC(AI、大数据、云计算)融合大战略来说,补齐GPU是应有之义。举例而言,影视业里的渲染和制作目前已经大量使用了基于云计算形态的GPU集群。动画片自不待言,反映中国女排的电影《夺冠》中,浩大体育馆里的观众画面就采用了大量的GPU来参与画面制作,并不是真的请了那么多的群众演员。
而从国内外形势的不确定性以及高科技之间的强对抗性来看,国产化替代和供应链安全变得愈发重要,而摆脱依赖性最起码要有备胎,要做长远打算。陆安表示,一方面,数据中心和高性能计算客户希望GPU供应链更多元化,而降低单依靠一两家厂商的风险;尽管华为在服务器领域已有CPU、AI芯片等,但如不解决GPU底层的问题,有可能会陷于被动。另一方面,未来AI发展对算力的要求不断提高,虽可采用不同的方案和思路,但一定要沉下心来做GPU的开发,否则技术差距会进一步拉大,未来以AI为代表的新基建也将难免受制于人。
相比于华为的“家国情怀”,对于英特尔的卷土重来,也有分析说原因在于GPU在数据时代是大势所趋,炙手可热,对于“以数据为中心”转型的英特尔而言,或不愿自己只能在AMD和英伟达作出选择。同时,英特尔亦需要新的收入来源来证明自己是未来数据时代的领导者。
突围?
而入局之后的问题也随之而来,在这一领域如何突围?
陆安提及他最深刻的体会是一定要有人才。“中国多年来在GPU基本少有建树,主要是缺人才的培养,因为科研院校也不关心,整个师资力量没往这方面铺,更多的人是侧重应用层。同时,国产GPU缺乏市场应用,在国外产品和技术的打压之下,很难通过市场化的方式推进技术迭代。”显然,这些问题也需要顶层设计来解决。
此外,生态也是重要的一环。戴辉剖析霸主英伟达的胜利之路,主要原因是其CUDA完整编程和工具链平台生态的构建,让业界很容易采用平台去开发相应的应用,就如微软的操作系统一样。用得越多,成本越低,反馈到硬件端,功耗、面积也能不断优化。华人黄仁勋创立的英伟达在CUDA上坚持研究了十余年,投入数亿美元,历经曲折,后来又因为AI和无人驾驶的契机,才奠定了先发优势。
戴辉认为,国内的游戏行业做得很好,华为在智能手机“吓人的”GPU TURBO等改良层面对游戏已经有了很好的理解,因而与云游戏的合作也好商谈,这是一个弯道超车的好机会。在无人驾驶领域,国内也在崛起,这也是GPU弯道超车的发展机遇。而这样的替代案例业已显现,特斯拉最早采用的是英伟达的GPU,已开始使用自研的FSD芯片。
毕竟,华为的底气十足。华为在韩国建立公司并志在将英伟达的高端人才纳入麾下,这招是很接地气的。在技术上,华为的实力有目共睹,在网络交换技术领域有多年的深厚积累,在AI芯片领域也在攻城略地,GPU应有力量破局。应用层面,华为自身和合作伙伴可基于大量的应用来训练GPU,不断升级。
而市场或是最终极的考验。一位台湾资深人士表示,华为开发GPU有量、有巿场培养就有戏。每个设计或制造都需要众多用户使用及技术人员的改善,要基于用户的需求点来不断提升性能。因而只要有效能强几百倍的产品,客户会回头再土法炼钢吗?这是巿场上的抉择。
然而,尽管高手纷纷入场,但作为GPU霸主,英伟达也在全力筑高“护城河”。在接连收购Titan IC和Mellanox落定之后,英伟达不仅在云端AI芯片领域构筑了高壁垒,而且在广为应用的分布式训练上,通过GPU+RDMA+CUDA的强强组合,则更可提供AI+高速数据互联解决方案+网络安全加速的完整解决方案,在数据中心竞争中如虎添翼。
机会?
放眼望去,GPU市场强者恒强,但未来的机会仍存。陆安建议,重点是培养大量的专业人才,并在政策上加以引导,以加速国产GPU的市场化应用,这将会推进国内GPU龙头企业的崛起,同时加速GPU行业技术水平的提升和迭代。
这一建议蕴含深层次的产业逻辑:半导体业经过多年发展已进入到垂直整合模式阶段,无论是CPU还是GPU、FPGA等真正要发展起来,还要深化上下游产业的联动,服务器GPU需要主流的云服务厂商从需求侧提供切实的发展方向,并为GPU厂商提供机会进行迭代和优化。因而,呼吁国家尽快出台相应的政策,鼓励云服务厂商更多地采用国产芯片,这应是面对国际形势不确定性所需要确定的。
而机会也将在新的征伐中成就。陆安强调,目前国内还没有出现GPU龙头公司,而芯片业的发展规律是细分行业最后都会走向集中,因而仍有机会布局。未来5~10年或会形成GPU龙头,年营收或突破100亿元。同时,随着各种创新技术层出不穷,有可能颠覆传统的GPU格局而实现弯道超车。
以智能手机芯片发展史为鉴,找到正确的发展方向,借助量大面广的市场,最终成就手机供应链的国产化。陆安指出,国产GPU的研发一定要脚踏实地,沉下心来,遵循芯片本身发展规律,让GPU性能不断突破,产品不断迭代,同时不被资本牵着走,未来国内一定能在GPU领域锻造出强实力。
可喜的是,在强压之下,国内已有一些企业如景嘉微、航锦、中船709所、兆芯、龙芯等在加强自主开发,在GPU性能、成本、应用上不断发力,并在着力向通用市场进军。
反观这次GPU的主角华为,近年来在层层打压之下也仍一直急速向前,自研芯片的脚步不断从手机扩大到AI、数据中心,如今在GPU领域重兵压阵,未来GPU格局将如何演变?
(校对/范蓉)