推理能力成为大模型性能提升的驱动引擎
2024 下半年以来,国内外大模型公司纷纷推出推理模型,通过以 CoT 为代表的推理框架,加强大模型对复杂任务处理能力和自主决策能力。
部分大模型公司的推理模型发布情况
来源:佐思汽研《2024-2025 年 AI 大模型及其在汽车领域的应用研究报告》
推理模型的密集上线,是为了提升大模型在复杂场景下的应对能力,同时也为 Agent 上线奠定基础;具体到汽车行业,汽车大模型推理能力的提升,能够切实解决 AI 应用场景下的痛点问题,如加强座舱助手对复杂语义的意图识别和提升自动驾驶规划决策中的时空预测场景精度。
部分汽车 AI 应用场景下对大模型推理能力的需求
整理:佐思汽研
2024 年,上车的主流大模型推理技术仍以思维链 CoT 及其变种为主(如思维树 ToT、思维图 GoT、思维森林 FoT 等),在不同的场景下会融合生成模型(如扩散模型)、知识图谱、因果推理模型、累积推理、多模态推理链等技术。
如吉利提出模块化思维语言模型(MeTHanol),让大语言模型合成人类思维并用于监督 LLM 的隐藏层,通过适应日常对话和个性化提示,生成类似人类的思维行为,增强大语言模型的思维和推理能力,并提升可解释性。
MeTHanol(含中间思维层的双层微调和两阶段推理)与标准 SFT 技术的对比
来源:吉利
2025 年,推理技术的重点会向多模态推理转移,常用的训练技术包括指令微调、多模态上下文学习与多模态思维链(M - CoT)等,多通过多模态融合对齐技术与 LLM 的推理技术结合而成。
部分多模态推理技术
整理:佐思汽研
可解释性成为 AI 与用户的信任桥梁
在用户体会到 AI 的“好用”之前,首先需要满足用户对 AI 的“信任”,所以,2025 年,AI 系统运行的可解释性成为汽车 AI 用户基数增长的关键一环,该痛点也可通过长思维链的展示来解决。
AI 系统的可解释性可通过数据可解释性、模型可解释性和事后可解释性三个层面分别实现:
AI 可解释性的三个层面
来源:IEEE;整理:佐思汽研
以理想为例,理想 L3 智驾通过 “AI 推理可视化技术”,可直观呈现端到端 + VLM 模型的思考过程,涵盖从物理世界感知输入到大模型完成行驶决策输出的全流程,提升用户对智能驾驶系统的信任。
理想 L3 智驾的可解释性
来源:理想
理想的“AI 推理可视化技术”中:
- Attention(注意力系统)主要负责展示车辆感知到的交通和环境路况信息,能对实时视频流中的交通参与者进行行为评估,并使用热力图展示评估对象。
- E2E(端到端模型)用于展示行驶轨迹输出的思考过程。模型会思考不同的行驶轨迹,展示 10 个候选输出结果,最终采用概率最大的输出结果作为行驶路径。
- VLM(视觉语言模型)可展示自身的感知、推理和决策过程,其工作过程使用对话形式展示。
同时,理想 Agent“理想同学”也提供可视化的工作流:
“理想同学”工作流
来源:理想
同样通过长思维链进行推理流程拆解的还有各个推理模型的对话界面,以 DeepSeek R1 为例,在与用户的对话中,会先通过思维链展示每一个节点的决策,并通过自然语言进行说明。
DeepSeek R1 长思维链界面
来源:DeepSeek R1 对话界面
此外,智谱的 GLM-Zero-Preview、阿里的 QwQ-32B-Preview、天工 4.0 o1 等大部分推理模型均支持长思维链推理流程展示。
DeepSeek 降低大模型上车的门槛,性能提升与降本兼得
推理能力乃至综合性能的提升,是否意味着需要付出高额成本?从 DeepSeek 的爆火来看,并不是。2025 年初,主机厂先后接入 DeepSeek,从应用详情来看,基本上是以提升车载大模型的综合能力为主。
2025 年初,部分主机厂与 DeepSeek 合作情况
整理:佐思汽研
事实上,DeepSeek 系列模型推出之前,各大主机厂已经按照自己的节奏有序推进旗下车载 AI 大模型的开发与迭代工作。以座舱助手为例,部分主机厂的方案已经初步完成构建,并已接入云端大模型供应商试运行或初步敲定供应商,其中不乏阿里云、腾讯云等云服务厂商以及智谱等大模型公司,2025 年初再次接入 DeepSeek,看重的包括:
- 强大的推理性能表现,如推理模型 R1 的性能与 OPEN AI 推理模型 o1 相当,甚至在数学逻辑方面更为突出;
- 更低的成本,在保证性能的同时,训练与推理成本均保持在同行业较低水平。
DeepSeek R1 与 OPEN AI o1 模型成本的比较
来源:公开信息
以上 2 点优势均在 DeepSeek 的技术创新上有所体现:
DeepSeek 系列的部分技术对大模型性能和成本的影响
整理:佐思汽研
通过接入 DeepSeek,主机厂在部署智驾和座舱助手时,可以切实地降低大模型性能硬件采购、模型训练与维护成本,同时保证性能不下降:
- 低计算开销技术推动高阶智驾、智舱平权,意味着低算力车载芯片(如边缘计算单元)上也可实现部署高性能模型,降低对高成本 GPU 的依赖;再结合 DualPipe 算法、FP8 混合精度训练等技术,优化算力利用率,从而实现中低端车型也能部署高阶座舱功能、高阶智驾系统,加速智能座舱的普及。
- 实时性增强,在汽车行驶环境下,智驾系统需实时处理大量传感器数据,座舱助手需要快速响应用户指令,而车端计算资源有限。DeepSeek 计算开销的降低使传感器数据的处理速度更快,可更高效的利用智驾芯片算力(服务器端训练阶段,DeepSeek 实现了对英伟达 A100 芯片 90%的算力利用率),同时降低延迟(如在高通 8650 平台上,芯片算力同为 100TOPS 时,使用 DeepSeek 推理响应时间从 20 毫秒降至 9 - 10 毫秒)。在智驾系统中,可确保驾驶决策及时准确,提升驾驶安全性和用户体验。在座舱系统中,支持座舱助手快速响应用户语音指令,实现流畅人机交互。
吉利星睿大模型的系统 2 接入 DeepSeek R1
来源:吉利
END
作者:佐思汽研
来源:佐思汽车研究
推荐阅读:
更多汽车电子干货请关注汽车电子与软件专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。