云中子〖计算杂谈〗 · 2023年12月29日 · 北京市

自动驾驶模拟如此“吃”算力,你的工作站扛得住吗?

今年的亚运会让杭州“火出了圈”,除了各种高度自动化的场馆设施之外,无人物流配送车和自动驾驶公交车也开始正式运营,给市政交通增添了一分科幻色彩。

杭州的自动驾驶公交车配备了3个激光雷达、4个毫米波雷达和5个摄像头,300米范围内的障碍物都能被识别和准确避开,精度达到厘米级。自动驾驶巴士通过在沿线全路段部署高清相机、雷达等智能感知设备,实现路网全息感知,并依托车路协同技术,实现了车与路的智慧互联,有效提升了车辆运行的安全性。

可以说,在完善的全息路网感知配合下,固定路线的自动驾驶公交车已经照进了现实!

其实一直以来,自动驾驶这个话题热度都非常高,但路面环境极其复杂,AI发展需循序渐进,算力、模型、传感器等都需要不断进步,才可逐步实现。

因此,各大汽车及解决方案厂商一直都在这方面持续发力,通过各种先进技术手段来完善产品。在这期间,专业软件设计、模拟软件(如ADAS)挑起了大梁,在它的帮助下可以降低测试复杂度并节省大量时间,帮助企业在激烈的竞争中博得先机。

自动驾驶,面临着海量数据处理的挑战

高级驾驶辅助系统(Advanced Driver Assistance System),简称ADAS,是利用安装于车上各式各样的传感器,在第一时间收集车内外的环境数据,进行静、动态物体的辨识、侦测与追踪等技术上的处理,从而能够让驾驶者在最快的时间察觉可能发生的危险,以引起注意和提高安全性的主动安全技术。

原理其实很好理解,但从复杂物体识别,到感知理解再到决策控制,这一系列操作均需在刹那间完成,可见ADAS研发的超高难度!

以物体识别为例:ADAS需要通过雷达及摄像头来识别路上的各种物体,包括车辆、人、交通标志等等,然而这些物体的种类、形状差别非常大,这就给计算、识别带来了挑战。因此,我们经常看到车企们都在不停地测试、实验,力求让自动驾驶更加“聪明”。

来自西门子的Simcenter Prescan™是车企们青睐的一套软件,提供了一个基于物理的仿真平台,主要用于高级驾驶辅助系统(ADAS)和自动驾驶系统的原型设计、仿真测试和性能验证。

与物理测试不同,Simcenter Prescan中的参数始终可以量化和控制。通过简单地修改系统参数并运行仿真,可以快速、经济、高效地进行设计迭代。因此,使用Simcenter Prescan可以显著减少推出ADAS和自动驾驶系统所需的工作量。

Simcenter Prescan在虚拟场景的搭建、虚拟传感器仿真和虚拟车辆模型上有着良好的功能支持。整套仿真测试环境可以围绕着Simcenter Prescan生成的场景和传感器搭建起来,只需搭配一些软硬件接口转换设备即可实现。

虚拟传感器结果的计算,通常是以图形渲染引擎为核心进行的。根据不同传感器的分辨率参数规格,常见的包括2MP(百万像素)、4MP、8MP不等,会有不同的图形计算能力的需求。例如针对8MP(相当于4K)分辨率级别的车载摄像头仿真,对图形算力的要求已经很高,需要搭配高性能的GPU来保证其性能表现。

算力为王,高性能工作站扛起一切

OK!那么问题来了,如果自动驾驶汽车同时输出10份较高分辨率视频,那么需要多高的算力才能支持呢?

西门子给出的案例是需要3台高性能工作站!

Simcenter Prescan虚拟摄像头传感器的通过分布在三台主机上的RTX A5000图形卡,将各个画面传输到屏幕上,用来模拟传输到自动驾驶域控制器的同等情况。三台主机通过一台交换机组成小型局域网,确保各机上的仿真程序能够保持同步。

所有虚拟摄像头传感器设定的刷新率统一为每秒30帧。由于Simcenter Prescan会强制同步所有传感器输出,所以整套仿真平台的仿真速度能否达到预期的设定值,取决于所有传感器中最低表现的那个。为了确保每个传感器计算有足够的性能冗余,需要将各个传感器按照一定的方式分布于各台主机所搭载的图形卡上进行。

通过西门子官方的详细测试,结果如下图,RTX A6000、RTX A5000、RTX A4000这三款不同级别的专业图形卡,所能满足的虚拟摄像头规格可分为三种等级,也与计算性能成正比。

对于高负载,长时间的ADAS模拟测试,在对比消费级显卡产品后,官方还是推荐用户选择硬件及驱动更加稳定的专业图形卡产品。尤其是在使用单机多卡的配置情况下,专业图形卡在显卡的功耗控制、散热处理及多卡连接等方面做足了优化设计,能更好地配合Simcenter Prescan的高效运行。

由此可见,若想构建一套成熟的自动驾驶系统,需要“吃掉”海量的算力啊!

戴尔Precision塔式工作站,助力自动驾驶模拟

对于工作站的选型,西门子官方也给出了建议,官方依然推荐戴尔Precision塔式工作站系列,其中可适用于ADAS的产品很多,囊括了戴尔Precision 3000/5000/7000系列,用户可以根据自己的实际需求来进行选择。

以全新戴尔Precision 7960塔式工作站为例:

Simcenter Prescan主要使用专业图形卡进行虚拟传感器的渲染仿真工作。然而,某些特定功能,如镜头畸变等特效处理,仍需要CPU的算力支持。

通常情况下,配备8至10核心的CPU可以满足一般需求。但随着虚拟传感器数量的增加,建议选择更多CPU核心的工作站。全新戴尔Precision 7960塔式工作站最高可搭载56核英特尔®至强®处理器,满足ADAS对更多传感器和处理线程的支持需求。

另外,更多的内存可以缓存数据并提升性能。Simcenter Prescan软件也依赖内存带宽,因此建议内存分布在更多的内存插槽上,分摊更多的内存通道,有效避免内存数据传输瓶颈造成的性能下降。全新戴尔Precision 7960塔式工作站最高可搭载4TB 4800MHz DDR5 8通道内存,并采用ECC纠错的内存技术和Reliable Memory Technology Pro,确保系统稳定性。

伴随着更高分辨率传感设备的加入以及数量的添加,务必选择更高性能的专业显卡RTX A5000/A6000级别,以保障图形的实时渲染输出。全新戴尔Precision 7960塔式工作站最高可配四个300W显卡,支持高级工程和人工智能GPU工作负载。

不仅如此,全新戴尔Precision 7960塔式工作站还拥有广泛的ISV认证,可以确保软硬件100%兼容,使得各种专业应用运行流畅不崩溃,充分发挥硬件资源的最大潜能。

此外,全新戴尔Precision 7960塔式工作站搭载Dell Precision Optimizer智能调优功能,可以全面智能调节系统设置,将重要应用程序如Simcenter Prescan软件,分配较高的优先级以提高性能,分析系统并生成工作负载、系统性能和系统诊断的报告,根据工作方式对性能进行个性定制。内置的AI智能平台可不断学习并适应工作方式,打造更智能、更具个性化的体验。

在政策、互联网跨界竞争、消费者内在需求等因素驱动下,ADAS市场渗透率将快速提升。就目前的技术来看,ADAS系统需要突破的是外界信息采集的精度和数据处理能力,这方面则是需要Simcenter Prescan与戴尔Precision这样的软硬件相互配合,才能日趋完善。

总之,随着IT技术的飞速发展,未来ADAS技术将不断进化,进而实现更智能、更安全、更舒适的驾驶体验。汽车自动驾驶,离我们的生活又近了一步!

推荐阅读
关注数
853
内容数
99
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息