徽州骆驼 · 1月11日

浅谈智能座舱SoC芯片

以下文章来源于阿宝1990 ,作者阿宝1990

汽车不仅仅是进入到新能源时代,也同步加速跨入了智能时代。新的消费群体对于数字化和智能化体验更加看重,智能座舱已经开始成为车企的主要卖点,也成为消费者购车的重要参考依据。

image.png

从用户购买决策的关键因素来看,根据IHS Markit最新的调研结果,座舱智能科技配置水平是仅次于安全配置的第二大类 关键要素,其重要程度已超过动力、空间与价格等传统购车关键要素,反映出座舱智能科技已成为用户购车的重要考量。

高算力芯片是保障智能座舱的“基石”,而高工艺的制程技术是支撑高算力的必要条件,7nm甚至更高的SoC是未来智能座舱的主流。

早在5年前,座舱里面的零部件基本上都是MCU来完成的,在没有大的屏幕和动效情况下,以前的座舱零部件99%都是MCU来完成,哪怕是刚开始出来的液晶仪表,很多都是使用MCU来驱动的。

image.png

我们可以看到这样一个并不复杂UI的界面的液晶仪表,图像只能达到2.5D的显示效果,此时使用的芯片方案就是一个MCU,当时我们在设计的时候,还需要反复考虑该方案的存储芯片的大小,为了尽量减少内存,指针做成旋转的方式,这样占用的图片资源就不用那么多,简直像极了一分钱半成两半来花,根本不用谈及算力的概念。

image.png

那个时候智能座舱的智能化设备还只能提供一些简单的功能,比如语音互动播放音乐,比如点下屏幕开始播放视频。这些类似于普通家电设备所需要的芯片只需要22nm的制程就足够支持这些功能。那个时候的汽车的车载芯片实际技术含量远远低于消费品的芯片,只是在应用场景上比消费品芯片要苛刻。所以经常导航卡顿,触摸不灵敏是常有的事情,以至于很多人对于汽车座舱电子的印象始终还停留在那个阶段。

座舱芯片高算力芯片成为刚需

从驾驶座舱到智能空间,在“软件定义汽车”的大背景下,汽车座舱成为全球芯片厂商竞逐的下一个战场。汽车座舱内的应用正和手机越来越像,高算力SoC芯片正成为新一代智能汽车的刚需。而随着高通等消费电子芯片厂商的入局,以及国内汽车芯片厂商的崛起,这一颗车载芯片市场竞争格局也在悄然发生变化。这背后的核心原因在于,“软件定义汽车”需要先进的汽车硬件架构和强劲的算力支持,智能化程度越深,座舱对主控芯片的算力要求也越高

随着座舱从电子座舱转向智能座舱的阶段,座舱座舱作为人车交互的直接触点,功能进一步进化,流媒体后视镜、HUD功能的渗透包括高分辨率的提升,对芯片的算力提出了高要求,促进了座舱由MCU向高算力的SoC的变化。

“我们都知道一切智能化终端的背后,运算一定是关键。这需要要把软件做好,同时更需要硬件的配合——就是那颗芯片。目前做终端做得非常优秀的,比如苹果、华为等厂商都是非常深度地定义这颗关键的主控SoC芯片,这也是智能化应用的底层逻辑,即‘人机交互+OS+芯片’。”所以汽车座舱往智能化走,芯片没有高算力,没有办法让座舱智能起来。

一芯多屏”逐步成为趋势,也是高算力SoC芯片的用武之地。

当前,智能座舱正在加速从单一功能的升级,逐步向大算力域控、更多人机交互功能以及深入融合进行演进。在这一过程中,传统汽车的功能芯片已经无法满足需求,大算力智能座舱SoC芯片的需求大幅高涨。

image.png

可以看到传统的座舱电子里面的控制器基本上是分开的,导航主机是一家,液晶仪表是一家,同时还有一个AVM全景一家,还有TBOX等,这里线束连接就非常复杂,而且不同供应商直接的协调调试也非常复杂。

image.png

可以看到,如果中控导航和液晶仪表的互动越来越频繁,中控上的导航地图,音乐等信息,需要传输到液晶仪表上进行显示。此时采用传统的方案,需要将中控导航的图像数据传输到液晶仪表上,需要增加对传芯片,同时如果需要将一些音乐信息也传输到液晶仪表上显示,此时还需要走单独的私有CAN协议,这样才能保障信息的传输,整体设计方案复杂,而且可靠性也存在一定的问题,信息传输耗时比较久。

image.png

上图是IMX6 的多芯片方案,液晶仪表、中控导航、后排娱乐都使用了IMX6最小系统,这样上图黄色框里面的内容就资源重复了,但是如果只用一颗IMX6又不能带动三个显示屏,所以很多存储资源没有办法进行最大化的利用,反复的浪费了计算和存储资源。

image.png

一芯多屏使多个屏幕的信息能自由流转,跨屏互动。

从性能上来看:座舱交互需求越来越多,就上面提到的,中控导航和液晶仪表之间都有非常多的信息交互,一芯多屏方案中信号的传输在芯片内部就完成了,不需要外部对传芯片以及CAN&LIN总线的传输,大幅度的降低了通信时间,有利于打破多芯片方案间由于信号传输延迟导致的性能局限。

从成本来看:单芯片方案的外围DDR和EMMC方案比多芯片方案数量减少,系统可靠性提升,虽然现在的单芯片成本比较贵,但是总体趋势来看,未来2年以后的整体成本是优于多芯片方案。

咱们有提到,传统的座舱电子,主要应对于简单指令的处理,因此采用由 CPU+存储+外设接口组成的 MCU 芯片,即可满足其对于算力的需求。但随着汽车向集中式架构迭代,域控制器的出现,使得大 量 ECU 被功能性整合,原有分散的硬件可以进行信息互通及资源共享,硬件与传 感器之间也可实现功能性的扩展,而域控制器作为汽车运算决策的中心,其功能的 实现主要依赖于主控芯片、软件操作系统及中间件、算法等多层次软硬件之间的有 机结合。

同时,为了赋予汽车更高级别的智能化功能,域控制器需要处理由传感器 传来的环境信息,其中,涵盖了海量的非结构化数据,这就导致面向控制指令运算 的 MCU 芯片难以满足其复杂的运算。相比之下,SoC 芯片引入了 DSP(音频处 理)、GPU(图像处理)、NPU(神经网络处理),使其不仅拥有控制单元,还集成 了大量计算单元,从而能够支撑多任务并发及海量数据的处理。根据极术社区的测 评,SoC 芯片的算力可高达 1012次/秒,是 MCU 芯片算力的指数级倍数。

一芯多屏技术最早由奔驰在 2018 年量 产,用域控制器 DCU 替代 ECU,底层芯片集成 GPU。优势是:能使座舱内图像、视频处 理算力大增,缩短因系统功能增加带来的系统时延,成本上降低复杂线束成本、布线成本以 及通信成本。

今年1-10月搭载智能座舱交付量达到192.67万辆,份额占比达到27.05%,这个是一个非常明确的趋势,智能座舱域控制器,一芯带多屏的时代即将到来。

智能座舱搭载的功能越多,对芯片算力要求就越高。目前车机上的APP应用还没有手机上的那么丰富,很多刚需应用在车机上还不普及,比如购物、金融、在线视频等,前几代的车机芯片都会落后手机芯片2-3年,现在由于智能座舱的“一芯多屏”的应用,以及智能交互的应用,车机芯片的算力要求已经追齐甚至超过手机芯片了。

智能座舱的“第三空间”所需要的多模交互让算力需求暴涨

智能座舱是实现千人千面汽车驾乘体验的重心所在,新势力车企与领先自主品牌车企率先发力,“大屏化”、“多屏化”、“多模态交互”、“一芯多屏”成为座舱发展的热门趋势,伴随着传感器规模的增长与交互模式的复杂化,智能座舱对芯片的算力需求亦水涨船高。

image.png

你的印象中车机还是这个样子,又蠢又笨重,都恨不得立刻扔掉,而且人机交互就是一个惨不忍睹。

相信看了这个视频,你会觉得“这么烂的语音识别还能在车上出现,简直是无言以对了”
https://v.qq.com/x/page/u0016...

我们再来看看现在智能座舱应该有的样子:

image.png

比如机氪001的座舱,副驾说了一句“我想抽烟”,那么语音系统会自动识别出是副驾下达的指令,经过系统自动思考和分析后,会自动打开右侧副驾的车窗。即使车内整体环境嘈杂,车内的每个麦克风仍能准确识别对应座位发出的指令。

可以看到目前座舱的交互变得智能化,自然会,语音交互逐步代理更多的触摸交互,从最开始的触摸屏交互开始,到现在主流的语音交互,在L9上面的TOF识别手势交互,多模态中的“模态”指的感官,用户可以使用手势、触控、眼神、表情等多种方式进行人机交互。

image.png

看起来多模交互非常酷,实现起来可以是非常“苦”,涉及到多个传感器的融合,数据的及时处理,算法的应用等等,这个对于SoC的主芯片而言,每增加一个多模交互的场景,算力都是需要增加的。

image.png

从技术角度上看,影响算力的因素至少有22个,每一个因素都会对上层应用产生影响。每一个影响因素对算法产生的影 响不同,比如摄像头个数对全图检测的影响就是线性,其他影响因子不变的情况下,两个摄像头就是一个摄像头所需要 的算力的2倍。对于同样的算法,是多个影响因子共同起作用,这将导致对算力的要求大幅提高。

根据IHS专业的评估,SoC芯片需要高度集成CPU、AI处理单元、图像处理单元GPU、深度学习加速单元NPU等多个模块,才能满足高速运算和负责运算的需求,从而实现座舱的多传感器融合、多模交互,其中CPU和GPU尤为重要。

CPU 主要负责交互功能和应用程序 运行的逻辑运算,并承担着任务调度的职责,即根据不同的功能对应分配给不同的处理器。而在多模态的交互以及日渐丰富的应用生态驱动下,CPU 的算力将呈现 数量级增长(CPU 算力一般高于 50KDMIPS 即能运行智能座舱流媒体、AR 导 航、AR-HUD 等主要功能)。

对于座舱中的娱乐信息系统而言,车载应用通常为多任务并发形式,因 此芯片的多重并行计算能力愈发重要。同时,叠加应用的高并发+图像显示的高标 准(即图像显示复杂度、精细度和实时性),将驱动 GPU 逐渐从 CPU 中分化为图 像专用的处理器以承载其所需的高性能计算能力,以及较高的渲染能力。其中,对 于 3D 图像效果,200GFLOPS 以上即能满足 3 个屏幕以上的图像显示,而针对 GPU 进行图像算法处理,则需要 500GFLOPS

image.png

可以看到2024年的NPU需求是2021年的10倍左右,CPU需求是2022年的3.5倍。在智能座舱未来发展的情况下来看,高算力尤为重要。

上百种感知算法为主机厂打造个性化上层应用,完成差异化战略部署;算力支持提供整车生命周期的软件迭代空间的同时,才能满足千人千面的感知功效需求。

国产的SoC 在这波智能座舱域控制芯片浪潮中也有异军突起,非常亮眼。

image.png

根据Strategy Analytics数据,2015年瑞萨、恩智浦合计占据整个车机芯片市场份额的六成以上,其中瑞萨在驾驶舱、仪表份额达到47%、44%;座舱芯片市场主要由汽车电子厂商为主导,其中包含瑞萨、NXP、TI 等 玩家;2015 年之后,以高通、英特尔、三星、联发科为主的消费电子厂商强势入局。

但 2021 年后高通在座舱市场中强势翻盘,斩获超 80%的份 额。我们认为,在这芯片市场易主的背后,是芯片算力的强势较量,通过 CPU/GPU 性能来比较,高通的 8155 芯片对应算力分别为 105K DMIPS、1142 GFLOPS, 远远领先传统的汽车电子厂商2倍以上,导致传统的瑞萨、NXP、TI芯片丢盔弃甲,毫无招架还手之力,因为高算力芯片更符合复杂的交互、应用功能及图像显示的高算力需求。

正在崛起中的本土汽车芯片初创企业也将是一大变量。过去两年,本土厂商芯擎、芯驰、四维图新(杰发)、瑞芯微等相继推出了面向中高端市场的智能座舱芯片。其中芯擎的7nm座舱芯片“龍鷹一号”则剑指8155,也是首款国产车规级7nm智能座舱芯片。目前该芯片在量产车型的测试和验证的各项工作已陆续完成,并预计今年下半年实现量产。

“龍鷹一号”是芯擎科技推出的国内首款7nm车规级高算力多核异构智能座舱高端处理器,内置8个核心CPU、14核心GPU以及8 TOPS AI算力的NPU,可以实现90K DMIPS的CPU算力和900GFLOPS的GPU算力,性能指标可以对标目前国际市场上最先进的产品。

芯擎科技2021 年 12 月发布了国产第一颗 7nm 智能座舱芯片“龍鹰一号”。

image.png

从上面参数可以看到,在国产芯片里面我们看到可以同高通8155P直接扳手腕的芯片就是芯擎的龍鹰一号,虽然我们看到的GPU算力是900k,但是实际的GPU能力要强于高通8155,高通的8155是通过虚拟机进行中控导航和仪表的设计,由于虚拟机是需要占用一定的空间的,所以8155 加上虚拟机之后的实际用户可用算力要少于龍鹰一号SE1000。

SE1000在硬隔离的机制下帮助用户节省了虚拟机的 费用,同时芯片内部的GPU等资源可以在两个域之间灵活配置,满足AP和CP域的资源灵活划分,这个是非常利好的,目前QNX的虚拟机的费用可不便宜。

image.png

前面咱们提到GPU能力越强,可以做很多座舱流畅的内容,特别是用户体验角度出发,我们都看看龍鷹一号能为用户带来怎样的体验。

1、系统瞬间启动,全速运行。智能座舱芯片的算力决定了座舱内屏幕的数量、运行流畅度及画面丰富度,“龍鷹一号”高性能异构计算引擎提供澎湃算力,而高能效的处理器集群则配合独特的功能安全与信息安全硬件产品,快速构建车载智能化生态系统。

image.png

“屏幕的数量越来越多、分辨率也越来越高,要保障每一块屏幕都能流畅运行且不卡顿,对芯片性能具有极高的要求。“龍鷹一号”拥有出众的运算能力和协同匹配能力,能够增强车机的稳定性和操控性,提高响应速度,并支持一机多屏多系统。“龍鷹一号”最多可以支持7块2K的屏幕同时输出,完全可以满足目前甚至未来2-3年座舱内部显示的需求。

2、智能导航功能。据了解,一款好用的导航功能,背后不仅需要高效易用的人工智能引擎,还要强大的感知系统和丰富的视觉算法支持,这里的多模交互就是非常耗费算力的,需要有AI引擎。

image.png

3、视频播放。凭借“龍鷹一号”强大的视频编解码能力和高带宽的显示通道,展示车支持多个全高清屏幕的多媒体应用,实现多触控屏之间交互自如,两指滑动缩放和三指多屏任意切换。

image.png

4、智能语音通话。高性能音频信号处理单元及丰富的音频接口,配合语音AI加速引擎,支持丰富的智能语音应用。

image.png

5、游戏功能。强大的GPU渲染算力和多种图形硬件加速单元,在高清视频流畅播放的同时,支持3D游戏迅捷平滑操作,高带宽低延迟的LPDDR5内存带宽,保证多屏之间数据的实时交换。

image.png

想想当你没有开车,停在路边的时候,你媳妇用副驾驶屏幕在看高清视频节目,你还可以同时对另外一块屏幕进行王者荣耀,这是多么令人热血沸腾的事情,虽同出一个座舱里面,不再像以前需要有人妥协,播放一个人喜欢的内容,现在在座舱里面,各自安好,互不打扰,但是内心确实那样的温馨。

高算力需要采用更新的制造工艺来保障;


image.png

随着视觉、嗅觉、听觉、触觉等多方面的互动要求增加,智能座舱更多地和ADAS开始联动后,原有的车规级芯片所需要的算力急速增加。2021年上市的众多车型实际就在采用16nm的芯片,2021年高通8155开始采用了7nm的工艺来支持更多的场景应用。

我们可以看到,传统的汽车电子厂家,最新高阶使用的芯片算力普遍是16nm左右的,这个制程直接制约了算力提升,16nm工艺相比,7nm工艺在功耗、性能和面积上有很大提升,与16nm相比提升非常显著,超过其他几个工艺节点的升级幅度,从16nm升级到7nm,芯片面积可以缩小到原来的1/3。

从消费类芯片来看,要提升算力,最简单有效的就是增加核心。所以要满足智能座舱芯片算力的提升,同样需要在单颗芯片里面集成多个不同类型的核心。芯擎科技“龍鹰一号”为例,该芯片是由8个CPU核心、14核GPU、8 TOPS int8可编程卷积神经网络引擎以及其他核心高度集成的多核异构SOC芯片。除了多核堆叠外,该芯片还在存储、连接等“通道”方面做了优化,以保证三大核心群的算力充分发挥。

采用7nm工艺,除了提升算力以外,还有一个重要目的就是降低功耗,我们知道车里面的环境非常恶劣,经常都是高低温环境,在进行多模交互的时候,算力急剧的上升,此时需要控制好功耗,避免芯片超过结温,这个时候采用7nm的制程,能够有效的降低功耗。

来源:汽车ECU开发
微信公众号:
汽车电子与软件.jpg

推荐阅读:

更多汽车电子干货请关注汽车电子与软件专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。
推荐阅读
关注数
5417
内容数
207
汽车电子与软件行业的相关技术报道及解读。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息