最近,英伟达的多则新闻牵引着国内的神经。
在不久之前,这家美国芯片巨头确认,美国政府将要限制他们向中国提供A100和H100,这在海内外引起了轩然大波;昨日,英伟达修改了其汽车芯片路线图,取消了2024年推出Atlan的计划,并用Thor代替。
关于这个新旗舰的规格,英伟达并没有说太多。但他们强调,该平台在FP8精度下,能够获得2000TOPS的运算能力,这与当前一代的Orin相比,有了接近十倍的提升。在新闻稿中,英伟达进一步指出,DRIVE Thor 统一了车辆中传统的分布式功能——包括数字集群、信息娱乐、停车和辅助驾驶——以提高开发效率和更快的软件迭代。“当然,制造商也可以通过多种方式配置 DRIVE Thor 超级芯片。他们可以将平台的所有 2,000 teraflops 全部用于自动驾驶,或者将一部分用于车内 AI 和信息娱乐,另一部分用于驾驶员辅助。”英伟达在新闻稿中强调。
对于大多数人来说,最初认识英伟达应该是因为他们在PC显卡市场上的表现。近年来火热的挖矿和人工智能,也让他们杀进了数据中心的常客。但从Orin开始,英伟达似乎又成为了汽车市场被追捧的角色。但其实在英伟达于智能汽车大杀四方的同时,很多车厂也开始了自己的“定制”之路。如特斯拉就首先迈出了第一步,通用在日前也披露了他们的的自研汽车自动驾驶芯片的计划。
来到国内,包括电动车新贵在内的多路势力也在强势杀入智能驾驶芯片市场,而Orin自然也成为了他们的标杆。这也就是为什么在Thor发布了以后,有从业者打趣道:“英伟达的这颗芯片发布后,国内某些芯片公司需要连夜修改PPT。”
Orin,未量产先火
首先,我们必须强调的是,英伟达Orin其实今年才开始量产,他们这部分的市场份额也没有多高。但他们绝对是不容忽视。
在咨询了多名从业者——为何英伟达能够在智能驾驶芯片市场备受关注?他们给的答案除了说英伟达芯片拥有强悍的计算能力以外,CUDA更是重中之重。因为有了它,可以大大降低开发门槛。
所谓CUDA,是 NVIDIA 开发的一种并行计算平台和编程模型,用于在自己的 GPU(图形处理单元)上进行通用计算。CUDA 使开发人员能够通过利用 GPU 的强大功能进行计算的可并行化部分来加速计算密集型应用程序。
有行业从业人士告诉笔者,之所以英伟达会推出CUDA,是因为从十几年前开始,英伟达就一直吹嘘GPU是最强的计算平台,业界其实也对茨表示认可。但由于非常难编程,很少有开发者能够将其计算能力放大,也没能吸引更多码农的注意。英伟达CUDA项目的领导者Ian Buck也曾经在一次讲演中也曾用一张图分享了当时GPU编程的挑战。
于是,为了让GPU变得更通用,英伟达便在2006年启动了CUDA,并在过去十几年里推动整个CUDA生态发展,这也让他们有了将GPU从游戏往人工智能,再往智能驾驶推进的底气。
一个资深的GPU从业者也解析说,无论是人工智能还是智能驾驶,所有的软件、算法,归根到底,都是卷积,矩阵和傅里叶变换这些计算,而英伟达在过去十几年的发展中。投入了数千人去完善了底层的各种函数,再加上参与CUDA生态的人越来越多,这就进一步丰富了这个“武器库”。
而从智能驾驶应用开发流程上来看,类似感知融合、ADAS以及环视等功能大多是基于人工智能算法来开发的,而要实现上述功能,也要开发者投入很多精力去解决各种软件问题,而CUDA平台本身的算法,就能降低了开发者门槛。
于是,站在CUDA这个巨人基础上,走向智能驾驶的厂商盯上了NVIDIA Orin也就水到渠成了。当然,还有另外的因素影响,例如之前在ADAS时代呼风唤雨的Mobileye相对封闭,Snapdragon Ride未成气候,就给了英伟达机会。
据佐思汽车研究作者周彦武老师之前在一篇文章中介绍,英伟达不会甘心制作一个卖芯片的。在Orin平台上,他们提供全套算法,包括障碍物识别、路径规划、行为决策、执行策略、定位、地图流制造、自动泊车,还有底层软件系统,内含了QNX的驱动,CUDA生态系统等等。现在不仅是自动驾驶部分,Orin开发平台还全面进军座舱即DRIVE IX,包括了驾驶员状态监测、AR HUD、泊车视觉化、NLP自然语音识别、虚拟机、电子倒车镜后视镜等。
但是,正如国内多位智能驾驶从业者所说,在接受Orin带给开发者的便利的同时,我们同时也要付出更多,因为天下没有免费的午餐。简而言之,那就是当开发者们在享受英伟达所提供的这种高可编程性、高通用性的计算架构的同时,那就要接受付出更多的功耗和芯片的成本。
通用汽车自动驾驶部门Cruise的硬件负责人 Carl Jenkins在早前接受路透社的采访时也说到,他们之前也花了很多钱从某知名供应商(暗喻英伟达)处购买了GPU,因为他们所需的产品不多,所以没有议价权。于是他们决定自研自动驾驶芯片。
对于国内的智能驾驶开发者来说,还需要面对的一个问题,就是供应商的支持。虽然Orin能简化开发者的不少工作。但如上文所说,在真正落地的时候,还需要做很多的开发工作,这当然就少不了原厂的支持。然而,智能驾驶行业从业者告诉笔者,英伟达目前在国内只能对那些大客户更好的扶持。例如在Orin上,因为蔚来ET 7是他们在国内的首款量产汽车,他们自然获得了最多的支持,但在其他的一些厂商处,英伟达也爱莫能助。
面对这种情况,国内的汽车芯片从业者首先冒了出来。
国内公司的跃跃欲试
某知情人士告诉笔者,现在国内做智能驾驶芯片的厂商两只手已经数不过来了。“之前一些专注于AI芯片的厂商,现在也开始转到智能驾驶芯片这个赛道上来了”,该人士接着说。
据不完全统计显示,国内做自动驾驶芯片公司包括但不限于地平线、黑芝麻、奕行智能、欧冶半导体、复睿微、芯励智能和核芯达等第三方芯片公司。除了他们以外,如上文所说,包括小鹏、理想和蔚来在内的新造车势力也对智能驾驶芯片虎视眈眈,并都组建了团队投入其中。此外,据行业人士透露,之前采用英伟达Orin的元戎启行也开始了自研芯片的。甚至连一些初期表示做AI芯片的公司,也都转到了这个赛道上来。
由此可见,可其他芯片领域一样,“国产Orin”的热潮正在汹涌来袭。但正如一些行业专家所说,这并不是一件容易的事情。因为这首先是一个复杂的SoC——除了需要强悍的处理性能,还要连接摄像头,处理各种感知融合的数据,那就意味着这个SoC除了要有ISP、NPU和各种接口外,还需要集成车规级别的Arm 处理器内核,这就使得其比很多芯片要难得多。
华为在2020发表的一个白皮书中也指出,智能驾驶涉及到感知、融合、定位、决策、规划、控制等多个环节,不同环节所需算力类型不同。比如激光雷达的点云数据处理需要大量CPU算力,摄像头数据则需要AI算力才能快速处理,在定位、决策、规划、控制等强逻辑处理的环节又需要CPU算力。换而言之,智能驾驶需要多样化的异构计算能力。
其次,作为一个应用在汽车上的芯片,除了各种车规级认证需要过以外,还要考虑包括功能安全在内的各种安全问题。以英伟达的Orin为例,有知情人士告诉笔者,现在国内有些团队根本连英伟达Orin的安全设计的门都还没摸到,更不要说要做国产的Orin。该人士同时表示,国内有些做“Orin替代”的厂商本来的思路是安全对标Orin,性能超过Orin,以提高产品的竞争力,但现在英伟达不讲武德地推出了Drive Thor,让人措手不及。
不过,和一些单纯想用算力做超越的厂商不一样,有些厂商也提出了有效算力的说法。例如在智能驾驶芯片方面跑得比较前的地平线就认为,只有综合考量了软件、算法、硬件架构的设计,就能持续推进端到端整体的计算架构计算效率持续往前演进。
黑芝麻也认为,在软件定义汽车时代下,除了硬件要有竞争力以外,开发工具链是否完善是体现自动驾驶芯片易用性的重要指标,只有软硬件完全解耦,才能激发整个产业链的创造力和协同创新的活力。
奕行智能的创始人刘珲在今年年初融资的新闻稿中也表示:“一家自动驾驶芯片公司要成功不在于有多么颠覆性的算法、多么强大的硬件指标或是多么大牌的单点核心人物,而是应该能够把算法和应用以最均衡的工程方式映射成软件和芯片,并且能够最终把其产品化和商业化。”
为了达成自己目标,这些本土芯片公司除了在国内组建团队以外,还在海外投下重金。据笔者了解,包括小鹏、黑芝麻和元戎启行都在美国圣地亚哥组建了芯片团队,以加速公司的发展。
写在最后
华为在上述的白皮书中说,从技术复杂度看:智能驾驶系统从功能上可分为三大部分:感知系统(各类传感器,相当于人的眼睛与耳朵)、决策系统(计算平台,相当于人的大脑)与执行系统(各类执行器,相当于人的四肢),其中汽车“大脑”功能最为复杂,涉及到多种ICT关键技术,比如:
软件类:操作系统、中间件、云服务、OTA等;
硬件类:芯片SoC、硬件工程(散热、能耗、抗振、防水等)、物理尺寸等;
算法类:聚类算法、机器视觉、深度学习、强化学习、机器学习等;
国内智能驾驶芯片企业资深从业者从业者也告诉笔者,这并不是一件容易的事情。因为产品在落地的过程中,还会碰到各种可能存在的硬件问题,同时还要解决系统软件、工具链、算法的不确定性。“有些公司可能会在感知算法落地的时候碰到问题,就算经过了感知关,来到规划控制的时候,又是另一个挑战。”该人士接着说。如何对算法训练优化,对于智能驾驶芯片公司来说,又是一道大考。
总而言之,从定义一颗智能驾驶芯片开始,到设计出一颗算力和安全都符合需求的芯片。从实验室中测试芯片,到最后前装上车,这将是一段漫长的过程。
更让人绝望的是,在国内厂商昨天还在为国产Orin芯片奋斗的时候,英伟达已经带来了性能提升八倍的Thor。这必将推动国内芯片的这场竞争进入新阶段。