历经十多年的厚积薄发,RISC-V已完成了从新兴势力到中坚力量的蜕变。
一方面,越来越多原本只专注于其他架构的大厂进入这个赛道,并交出了可观的成绩。如高通在截止2023年年底,就已经出货了6.5亿个RISC-V内核。英伟已经累计量产了约30亿颗基于RISC-V内核的芯片;
另一方面,除了在MCU市场势如破竹以外,RISC-V还在AI芯片市场找到了一席之地。无论是由Jim Keller等传奇芯片工程师成立的公司,还是类似Meta这样的巨头,都不约而同地看好RISC-V在AI市场的潜力。当然,国内外新成立的RISC-V公司也不胜枚举。在他们的共同推动下,这个新架构在消费电子、汽车、工业、PC甚至服务器市场开辟了新天地。
经过15年的发展,RISC-V终于来到了高性能时代。
站在这个风口上,阿里巴巴旗下拥有先发优势的达摩院玄铁团队正在RISC-V方面全力以赴。2月28日,玄铁团队在北京举办了RISC-V生态大会,不仅透露了行业第一代服务器级CPU的突破性进展,更展示了高性能生态的全图景。
这是一步关键的先手棋。
RISC-V迈向高端,处理器全线升级
作为阿里巴巴达摩院旗下的知名品牌,玄铁是国内最早投入RISC-V 架构的技术创新及生态建设的团队之一。
具体到产品方面,全系列处理器是玄铁的基本盘。自2019年推出第一款RISC-V处理器玄铁C910以来,达摩院玄铁团队打造了涵盖高性能、高能效和高实时的C(C910、C906、C907、C908、C920)系列、E(E902、E906、E907)系列和R系列(R908,R910)的玄铁处理器家族产品,以覆盖全场景的性能需求。应用方面也涵盖了智能终端、网络通讯、Al智算、服务器及周边等多个热门场景。
领先的竞争力反映在市场上。在去年的生态大会上,阿里达摩院院长张建锋就透露,搭载玄铁RISC-V内核的处理器出货量已超40亿颗,这也让玄铁成为国内RISC-V领域市场最受欢迎的处理器IP系列之一。
诚然,在行业发展的这个阶段,玄铁的RISC-V内核大多应用于类似MCU的嵌入式场景。但玄铁对高性能的情怀和野心早在C910已经埋下,那是一颗打破当时RISC-V性能天花板的处理器,是全球范围内探索高性能RISC-V的起点,在过去的几年里持续孵化出创新应用。
可以预见,玄铁即将交付的高性能处理器C930,将会成为RISC-V发展历程上的又一个里程碑。
因为历史发展原因,过去的高性能处理器市场主要由X86架构,甚至更早之前的IBM Power架构主导。但进入近年,多年尝试进入这个市场未果的Arm终于也找到了机会,在服务器芯片市场强势崛起。包括亚马逊、微软、谷歌在内的云服务厂商,也都纷纷推出了自研的高性能Arm服务器芯片,力求在这个原本由英特尔主导市场中分一杯羹,并已经取得了不错的成果。
由此,在很多人看来,和Arm同样是精简指令集、且还拥有高度可定制的特点的RISC-V也能站在巨人肩膀上,迅速在高性能处理器市场站稳脚跟。这也正是包括达摩院玄铁在内的团队大力推动RISC-V走向高端的的原因之一。
据悉,即将交付的玄铁下一代旗舰处理器C930是一款可媲美Arm Neoverse系列的处理器,采用15级乱序超标量流水线设计,支持CHI协议,以及多核多cluster可扩展,6译码宽度和10+发射宽度。凭借这些卓越设计,其SPECint 2006高达15分/GHz以上,达到服务器级别应用的水准,能够满足PC、边缘服务器和自动驾驶等高性能计算场景的需求。
在性能方面打下新标杆的同时,玄铁这次也透露正在研发C908X、R908A、XL200等新产品,向AI加速、车载、高速互联等方向持续发展。其中,C908X支持RVV1.0矢量扩展并增加至4096bit超长数据位宽,是玄铁首款AI专用处理器;R908A是一款可虚拟化的多核硬实时处理器,适用于车载场景的高可靠需求;XL200则能提供更高性能的多核多簇互联解决方案。
玄铁RISC-V的根基扎得更广、更深了。
生态并进,加快RISC-V挺进“高性能”深水区
众所周知,硬件需要软件,也需要有良好的生态助力其扩展应用并服务多样化场景。换而言之,能否将这些处理器更好地用起来,是有意转向RISC-V开发者所关注的重点。因此,除了在处理器的广度和深度上发力外,玄铁也在RISC-V的应用和生态上齐头并进。
据介绍,团队正在构建起以玄铁 RISC-V 为核心的高性能生态体系,与生态伙伴协同推动 RISC-V 芯片、开发工具、操作系统、应用解决方案等不同层面的软硬一体化发展,全力推动 RISC-V 软硬全栈技术多领域发展落地。
例如,围绕玄铁高性能RISC-V处理器,劳特巴赫提升了问题诊断和性能优化效率,兆松科技支持了编译优化,Arteris的NoC互联IP提供了高性能互联,纽创信安则提供eHSM模块和完整的安全启动流程。
以上各方强强联手,为的就是方便行业真正开发出高性能的玄铁RISC-V芯片。
在应用方面,去年的技术生态大会上,中国科学院软件研究所(以下简称软件所)宣布基于玄铁C910打造的业界首款开源RISC-V笔记本“如意BOOK甲辰本”。据介绍,该本子在openEuler操作系统上可流畅运行钉钉、Libre Office等大型办公软件。随着这个本子的发布,代表着RISC-V生态对通用计算支持能力的提升,也首次打通了从底层芯片到操作系统,再到商用软件的RISC-V全链路。
进入今年的技术大会,软件所透露,“如意BOOK甲辰本”已成功实现量产落地,他们也将推出内置64核玄铁C920处理器的RISC-V PC“如意BOOK乙巳本”。据介绍,该本子的AI算力较上一代提升3.8倍。
同时,软件所还带来了智能机器人、AI PC等RISC-V高性能应用。其中,基于玄铁C920处理器的AI PC概念机已经跑通Llama、Qwen、DeepSeek等开源模型,打通从开源硬件架构到开源操作系统、再到开源AI模型的“开源AI全链路”,单位计算能耗降低30%,支持AI个人助手、AI编程、AI视觉等能力,这也代表了RISC-V处理器在AI方面的又一次突破。
来到生态合作模式层面,在去年的玄铁RISC-V生态大会上,达摩院发起了RISC-V业内的一次全新尝试——联合头部企业及机构成立“无剑联盟”,具体而言就是基于玄铁处理器深度推进IP协同、工具链优化、操作系统适配、解决方案拓展、应用推广等工作,以持续降低RISC-V开发成本,缩短RISC-V产品及应用上市时间。
“无剑联盟”让这些头部玩家真正深度融合,碰撞出新的火花:
一方面,新思科技为C910处理器的设计、实现与功能验证提供了 VC Formal、VC PS、Fusion Compiler 等工具,达到了最佳的 PPA 指标,并与玄铁联合推出深度融合的“无剑300”芯片设计平台,助力芯片厂商缩短开发周期;
另一方面,Arteris的互联主线与玄铁高性能处理器完成适配,有望向更多高性能处理器客户复制推广。
历经过去一年的发展,也有首批RISC-V芯片自无剑联盟诞生:中国电信研究院基于TH1520芯片原型,打造业界首个RISC-V视频转码卡TeleVPU。据介绍,该卡成本较业界方案降低20%,具备20T AI算力和40路1080p高清视频编解码能力,单卡显存高达40G,并且已在现网部署。
有了这些样板,“无剑联盟”在今年又迎来了新成员的加入。
随着西门子EDA和Cadence主动加入,“EDA三巨头”在“无剑联盟”齐聚一堂;经纬恒润将基于RISC-V提供芯片定义、AUTOSAR基础软件和自研工具链开发,构建从芯片到软件的完整车规级解决方案;普华基础软件发布的首个规模化、量产级开源安全车控操作系统小满(EasyXMen)已完成与RISC-V架构适配,并将持续跟踪支持最新RISC-V架构相关规范,共建软硬协同的技术生态,推动RISC-V“上车”;此外,联盟还吸收了网易有道和国网南瑞,他们将各自在教育硬件和电网领域优先选择RISC-V架构推动相关的数智化升级。
在软件工具层面,玄铁也实现了重要整合,公司基于Android、Linux和RTOS三套操作系统适配,推出相应的三套SDK,将多年来积淀的玄铁软件能力全面整合,以更完整、便捷、稳定的方式向行业输出。特别是,玄铁Linux SDK提供包括Hypervisor虚拟化、CoVE安全框架、玄铁AI框架、高性能算子库在内的丰富子系统,助力RISC-V在高性能和AI场景的开发启航。
毕竟,硬件就是一个IP,但软件是一堆的软件栈和库,一个公司不能把所有的事情做完。大家取自于生态,让客户真正从中受惠,然后再把它回馈到生态中,这才是RISC-V发展的长久之道。
DeepSeek引发思考,开源的伟大
曾几何时,我们对于处理器的期待,都是以追求更强性能与更优体验为目标,这也正是达摩院玄铁团队不断冲击RISC-V高端处理器,并推出C930的原因之一。
C930跨过SPECint2006 15分这个分水岭之后,可能充分发挥面积小、功耗低的优势,渗透到服务器场景。也许,行业能在两三年后能看到基于C930的一个云实例。
在可见的未来,RISC-V仍会向高端化继续发力。英伟达的成功和路线图,也证明了这条路的正确性。但在去年底,本土大模型DeepSeeK横空出世,并以黑马之姿领跑全球的时候,引发了大家对人工智能以及芯片未来发展的一些全新思考:
一方面,和谷歌和OpenAI不一样,DeepSeeK是一个开源模型。一个开源模型能获得这样的成功,让大家看到了开源的价值和领先性。就连以打造闭源模型著称的OpenAI公司首席执行官Sam Altman也首次承认:“我个人认为,我们在这里站在了历史的错误一边,需要找出一个不同的开源策略。OpenAI中并非所有人都认同这一观点,这也不是我们当前的最高优先事项。”
作为主流指令集架构中唯一“生而开源”的,RISC-V的潜力令人期待。
DeepSeek带来的另一方面思考是——低算力也能让大模型成为可能。有了解过DeepSeek底层原理的读者知道,这个模型实际上是用更低的激活比去实现更低算力的成本,让单机部署也成为可能,而不再需要大型的服务器。正是这样的设计,打破了对传统架构的“迷信”。
算力架构,面临重新洗牌。
过去,大家认为并行计算只能用GPU去做。现在不光是GPU能做,基本市面上所有的计算体系架构都可以跟DeepSeek适配。CPU在AI领域的价值,值得被重估一次。
基于这些思考,达摩院玄铁在打造包括高性能处理器在内的多系列RISC-V处理器的同时,还考虑了原生AI算力的结合。为此,C930除了对标服务器级应用的通用高性能,也率先搭载了8 TOPS Matrix引擎,与前一代Vector引擎的AI算力相比实现飞跃。
与此同时,玄铁还在布局AI专用处理器,C908X就是其中一个代表。该处理器支持了超宽的矢令矢量指令集(可以达到4096 bits),让有需要的客户有余量去加一些非常宽的自定义指令集。
也给玄铁RISC-V预备了无限宽阔的AI未来。
写在最后
在谈到对未来发展规划的时候,玄铁表示,公司在坚持走好高性能和AI这两条路的同时,还将集中精力去迭代其处理器产品线,以满足开发者的多样化需求。
而作为对RISC-V基金会投入最大的中国机构,达摩院玄铁还将在联合国际头部合作伙伴,在完善高性能和AI新兴场景所需的软件生态的同时,对标准建设做出更多的贡献。率先提出了Matrix扩展指令,就是玄铁又一“敢为天下先”的代表作。
毫无疑问,RISC-V的高性能时代已然到来,玄铁团队也正在以技术创新为剑,以生态建设为盾,引领这一开源架构迈向新的高峰。