RISC-V高性能时代已来，玄铁再亮剑

历经十多年的厚积薄发，RISC-V已完成了从新兴势力到中坚力量的蜕变。

一方面，越来越多原本只专注于其他架构的大厂进入这个赛道，并交出了可观的成绩。如高通在截止2023年年底，就已经出货了6.5亿个RISC-V内核。英伟已经累计量产了约30亿颗基于RISC-V内核的芯片；

另一方面，除了在MCU市场势如破竹以外，RISC-V还在AI芯片市场找到了一席之地。无论是由Jim Keller等传奇芯片工程师成立的公司，还是类似Meta这样的巨头，都不约而同地看好RISC-V在AI市场的潜力。当然，国内外新成立的RISC-V公司也不胜枚举。在他们的共同推动下，这个新架构在消费电子、汽车、工业、PC甚至服务器市场开辟了新天地。

经过15年的发展，RISC-V终于来到了高性能时代。

站在这个风口上，阿里巴巴旗下拥有先发优势的达摩院玄铁团队正在RISC-V方面全力以赴。2月28日，玄铁团队在北京举办了RISC-V生态大会，不仅透露了行业第一代服务器级CPU的突破性进展，更展示了高性能生态的全图景。

这是一步关键的先手棋。

RISC-V迈向高端，处理器全线升级

作为阿里巴巴达摩院旗下的知名品牌，玄铁是国内最早投入RISC-V 架构的技术创新及生态建设的团队之一。

具体到产品方面，全系列处理器是玄铁的基本盘。自2019年推出第一款RISC-V处理器玄铁C910以来，达摩院玄铁团队打造了涵盖高性能、高能效和高实时的C（C910、C906、C907、C908、C920）系列、E（E902、E906、E907）系列和R系列（R908，R910）的玄铁处理器家族产品，以覆盖全场景的性能需求。应用方面也涵盖了智能终端、网络通讯、Al智算、服务器及周边等多个热门场景。

领先的竞争力反映在市场上。在去年的生态大会上，阿里达摩院院长张建锋就透露，搭载玄铁RISC-V内核的处理器出货量已超40亿颗，这也让玄铁成为国内RISC-V领域市场最受欢迎的处理器IP系列之一。

诚然，在行业发展的这个阶段，玄铁的RISC-V内核大多应用于类似MCU的嵌入式场景。但玄铁对高性能的情怀和野心早在C910已经埋下，那是一颗打破当时RISC-V性能天花板的处理器，是全球范围内探索高性能RISC-V的起点，在过去的几年里持续孵化出创新应用。

可以预见，玄铁即将交付的高性能处理器C930，将会成为RISC-V发展历程上的又一个里程碑。

因为历史发展原因，过去的高性能处理器市场主要由X86架构，甚至更早之前的IBM Power架构主导。但进入近年，多年尝试进入这个市场未果的Arm终于也找到了机会，在服务器芯片市场强势崛起。包括亚马逊、微软、谷歌在内的云服务厂商，也都纷纷推出了自研的高性能Arm服务器芯片，力求在这个原本由英特尔主导市场中分一杯羹，并已经取得了不错的成果。

由此，在很多人看来，和Arm同样是精简指令集、且还拥有高度可定制的特点的RISC-V也能站在巨人肩膀上，迅速在高性能处理器市场站稳脚跟。这也正是包括达摩院玄铁在内的团队大力推动RISC-V走向高端的的原因之一。

据悉，即将交付的玄铁下一代旗舰处理器C930是一款可媲美Arm Neoverse系列的处理器，采用15级乱序超标量流水线设计，支持CHI协议，以及多核多cluster可扩展，6译码宽度和10+发射宽度。凭借这些卓越设计，其SPECint 2006高达15分/GHz以上，达到服务器级别应用的水准，能够满足PC、边缘服务器和自动驾驶等高性能计算场景的需求。

在性能方面打下新标杆的同时，玄铁这次也透露正在研发C908X、R908A、XL200等新产品，向AI加速、车载、高速互联等方向持续发展。其中，C908X支持RVV1.0矢量扩展并增加至4096bit超长数据位宽，是玄铁首款AI专用处理器；R908A是一款可虚拟化的多核硬实时处理器，适用于车载场景的高可靠需求；XL200则能提供更高性能的多核多簇互联解决方案。

玄铁RISC-V的根基扎得更广、更深了。

生态并进，加快RISC-V挺进“高性能”深水区

众所周知，硬件需要软件，也需要有良好的生态助力其扩展应用并服务多样化场景。换而言之，能否将这些处理器更好地用起来，是有意转向RISC-V开发者所关注的重点。因此，除了在处理器的广度和深度上发力外，玄铁也在RISC-V的应用和生态上齐头并进。

据介绍，团队正在构建起以玄铁 RISC-V 为核心的高性能生态体系，与生态伙伴协同推动 RISC-V 芯片、开发工具、操作系统、应用解决方案等不同层面的软硬一体化发展，全力推动 RISC-V 软硬全栈技术多领域发展落地。

例如，围绕玄铁高性能RISC-V处理器，劳特巴赫提升了问题诊断和性能优化效率，兆松科技支持了编译优化，Arteris的NoC互联IP提供了高性能互联，纽创信安则提供eHSM模块和完整的安全启动流程。

以上各方强强联手，为的就是方便行业真正开发出高性能的玄铁RISC-V芯片。

在应用方面，去年的技术生态大会上，中国科学院软件研究所（以下简称软件所）宣布基于玄铁C910打造的业界首款开源RISC-V笔记本“如意BOOK甲辰本”。据介绍，该本子在openEuler操作系统上可流畅运行钉钉、Libre Office等大型办公软件。随着这个本子的发布，代表着RISC-V生态对通用计算支持能力的提升，也首次打通了从底层芯片到操作系统，再到商用软件的RISC-V全链路。

进入今年的技术大会，软件所透露，“如意BOOK甲辰本”已成功实现量产落地，他们也将推出内置64核玄铁C920处理器的RISC-V PC“如意BOOK乙巳本”。据介绍，该本子的AI算力较上一代提升3.8倍。

同时，软件所还带来了智能机器人、AI PC等RISC-V高性能应用。其中，基于玄铁C920处理器的AI PC概念机已经跑通Llama、Qwen、DeepSeek等开源模型，打通从开源硬件架构到开源操作系统、再到开源AI模型的“开源AI全链路”，单位计算能耗降低30%，支持AI个人助手、AI编程、AI视觉等能力，这也代表了RISC-V处理器在AI方面的又一次突破。

来到生态合作模式层面，在去年的玄铁RISC-V生态大会上，达摩院发起了RISC-V业内的一次全新尝试——联合头部企业及机构成立“无剑联盟”，具体而言就是基于玄铁处理器深度推进IP协同、工具链优化、操作系统适配、解决方案拓展、应用推广等工作，以持续降低RISC-V开发成本，缩短RISC-V产品及应用上市时间。

“无剑联盟”让这些头部玩家真正深度融合，碰撞出新的火花：

一方面，新思科技为C910处理器的设计、实现与功能验证提供了 VC Formal、VC PS、Fusion Compiler 等工具，达到了最佳的 PPA 指标，并与玄铁联合推出深度融合的“无剑300”芯片设计平台，助力芯片厂商缩短开发周期；

另一方面，Arteris的互联主线与玄铁高性能处理器完成适配，有望向更多高性能处理器客户复制推广。

历经过去一年的发展，也有首批RISC-V芯片自无剑联盟诞生：中国电信研究院基于TH1520芯片原型，打造业界首个RISC-V视频转码卡TeleVPU。据介绍，该卡成本较业界方案降低20%，具备20T AI算力和40路1080p高清视频编解码能力，单卡显存高达40G，并且已在现网部署。

有了这些样板，“无剑联盟”在今年又迎来了新成员的加入。

随着西门子EDA和Cadence主动加入，“EDA三巨头”在“无剑联盟”齐聚一堂；经纬恒润将基于RISC-V提供芯片定义、AUTOSAR基础软件和自研工具链开发，构建从芯片到软件的完整车规级解决方案；普华基础软件发布的首个规模化、量产级开源安全车控操作系统小满（EasyXMen）已完成与RISC-V架构适配，并将持续跟踪支持最新RISC-V架构相关规范，共建软硬协同的技术生态，推动RISC-V“上车”；此外，联盟还吸收了网易有道和国网南瑞，他们将各自在教育硬件和电网领域优先选择RISC-V架构推动相关的数智化升级。

在软件工具层面，玄铁也实现了重要整合，公司基于Android、Linux和RTOS三套操作系统适配，推出相应的三套SDK，将多年来积淀的玄铁软件能力全面整合，以更完整、便捷、稳定的方式向行业输出。特别是，玄铁Linux SDK提供包括Hypervisor虚拟化、CoVE安全框架、玄铁AI框架、高性能算子库在内的丰富子系统，助力RISC-V在高性能和AI场景的开发启航。

毕竟，硬件就是一个IP，但软件是一堆的软件栈和库，一个公司不能把所有的事情做完。大家取自于生态，让客户真正从中受惠，然后再把它回馈到生态中，这才是RISC-V发展的长久之道。

DeepSeek引发思考，开源的伟大

曾几何时，我们对于处理器的期待，都是以追求更强性能与更优体验为目标，这也正是达摩院玄铁团队不断冲击RISC-V高端处理器，并推出C930的原因之一。

C930跨过SPECint2006 15分这个分水岭之后，可能充分发挥面积小、功耗低的优势，渗透到服务器场景。也许，行业能在两三年后能看到基于C930的一个云实例。

在可见的未来，RISC-V仍会向高端化继续发力。英伟达的成功和路线图，也证明了这条路的正确性。但在去年底，本土大模型DeepSeeK横空出世，并以黑马之姿领跑全球的时候，引发了大家对人工智能以及芯片未来发展的一些全新思考：

一方面，和谷歌和OpenAI不一样，DeepSeeK是一个开源模型。一个开源模型能获得这样的成功，让大家看到了开源的价值和领先性。就连以打造闭源模型著称的OpenAI公司首席执行官Sam Altman也首次承认：“我个人认为，我们在这里站在了历史的错误一边，需要找出一个不同的开源策略。OpenAI中并非所有人都认同这一观点，这也不是我们当前的最高优先事项。”

作为主流指令集架构中唯一“生而开源”的，RISC-V的潜力令人期待。

DeepSeek带来的另一方面思考是——低算力也能让大模型成为可能。有了解过DeepSeek底层原理的读者知道，这个模型实际上是用更低的激活比去实现更低算力的成本，让单机部署也成为可能，而不再需要大型的服务器。正是这样的设计，打破了对传统架构的“迷信”。

算力架构，面临重新洗牌。

过去，大家认为并行计算只能用GPU去做。现在不光是GPU能做，基本市面上所有的计算体系架构都可以跟DeepSeek适配。CPU在AI领域的价值，值得被重估一次。

基于这些思考，达摩院玄铁在打造包括高性能处理器在内的多系列RISC-V处理器的同时，还考虑了原生AI算力的结合。为此，C930除了对标服务器级应用的通用高性能，也率先搭载了8 TOPS Matrix引擎，与前一代Vector引擎的AI算力相比实现飞跃。

与此同时，玄铁还在布局AI专用处理器，C908X就是其中一个代表。该处理器支持了超宽的矢令矢量指令集（可以达到4096 bits），让有需要的客户有余量去加一些非常宽的自定义指令集。

也给玄铁RISC-V预备了无限宽阔的AI未来。

写在最后

在谈到对未来发展规划的时候，玄铁表示，公司在坚持走好高性能和AI这两条路的同时，还将集中精力去迭代其处理器产品线，以满足开发者的多样化需求。

而作为对RISC-V基金会投入最大的中国机构，达摩院玄铁还将在联合国际头部合作伙伴，在完善高性能和AI新兴场景所需的软件生态的同时，对标准建设做出更多的贡献。率先提出了Matrix扩展指令，就是玄铁又一“敢为天下先”的代表作。

毫无疑问，RISC-V的高性能时代已然到来，玄铁团队也正在以技术创新为剑，以生态建设为盾，引领这一开源架构迈向新的高峰。

推荐阅读

目录