智驾网 2026-07-02 16:57
物理AI爆火,智驾技术迎来终局?
分享
2026 年上半年,随着国内多家头部企业先后发布基于世界模型、VLA、强化学习等核心技术的物理AI方案,行业从 "端到端范式" 正式迈向 "物理AI范式" 的新阶段。我们可以看到各家的方案都在走向趋同,都在强调世界仿真模型和强化学习的作用,也都重视VLA在车端方案中的作用。

2026年行至年中,中国智能辅助驾驶领域的“功能普惠”与“体系进化”双线并进,愈演愈烈。


城市NOA下沉至10万级家用车成为行业共识,百万级量产交付规模成为智驾玩家的竞赛点,例如轻舟智航成为继华为乾崑之后第二个NOA冲破百万量产大关的自动驾驶公司。根据行业数据来看,国内L2+辅助驾驶功能已成为主流配置,渗透率达68%-69%,几乎覆盖所有新能源车型与主流燃油车。


智驾底层技术同样在快速进化。当前,端到端方案已是高阶智驾的主流,以数据驱动和模型架构升级的方式,让自动驾驶系统的能力更拟人。随着城市NOA的规模化落地,需要智驾功能从“功能炫技”转向“长期用户价值兑换”,因此必然要求更加安全可靠的高阶自动驾驶系统,因此以“构造物理世界AI大脑”的新技术范式,就成为行业的新共识。


Image


以世界模型、VLA多模态统一模型为代表的物理AI,成为端到端架构升级的全新范式,也是头部企业一致投入的技术竞赛点。以全球物理AI基础设施提供商自居的英伟达,已推出"世界模型 + VLA + 数字孪生" 三位一体的自动驾驶全栈物理AI解决方案,特斯拉也早已为纯视觉端到端路线构筑起VLA+世界模型的底层物理AI能力。


回看国内,新势力当中的理想、小鹏都在构筑自己的世界模型+VLA的物理AI架构方案,华为乾崑是坚定的世界模型实践者,Momenta也推出了基于强化学习的世界模型方案、轻舟智航打造了基于世界模型+强化学习“的统一物理AI架构,卓驭也在构造基于原生多模态的移动物理AI方案。


至此,2026年下半场将彻底迎来自动驾驶的“物理AI”技术范式的大爆发。


01.

为什么物理AI是自动驾驶“最终解”?


过去数年,自动驾驶技术研发的核心一直是“解决车辆行驶单一任务”,感知、预测、规划独立,形成上下游模块,导致在复杂极端场景处理、跨城市路况泛化能力上难以有实质提升。


2022年之后,随着端到端技术范式的成熟,自动驾驶将感知、预测、规划任务全部模型化,并逐步放入到一个神经网络当中,极大提升了自动驾驶模型的能力上限,提高了规控的响应速度和系统的泛化能力。


2024年以来,随着AI大模型的爆发,特别是多模态大模型技术的成熟,行业开始认识到AI技术必然要从数字世界进入到物理世界。自动驾驶领域对于物理AI的探索也同期开始,VLA(视觉-语言-行动模型)、WM(世界模型)技术开始被逐步引入到自动驾驶领域。


世界模型的本质首先是一个“渲染器”,也就是能够构建一个强大仿真引擎,可以构造出符合真实物理环境的合成数据,解决自动驾驶数据稀缺问题。


其次世界模型需要成为一个“仿真器”,就是能够准确预测物理环境中参与物的运动状态和运动轨迹,真实还原物理世界的运动规律。


第三,世界模型需要成为一个“规划器”,也就是能够根据世界的实时变化来决定自车的行为轨迹,具备行为意图推理、物理规律理解和常识推理的规划能力。


世界模型的构建、训练,首先必然是在云端完成,需要足够的算力、海量的数据,依靠强化学习算法,进行无数次的环境学习和行为意图博弈,不断提升世界模型“规划器”的能力。


世界模型同时也必须能够成为一个车端模型,将学到的物理世界的知识应用到车端行为模型中,在车端发挥“感知-预测-行动”的一体化推理能力,实现完全类人甚至超越人的真实驾驶。


实际上,VLA模型就是通过一个多模态模型,特别是LLM(大语言模型)所掌握的世界知识来实现规划和控制,试图解决端到端算法“黑箱不可解释”的技术难题。


尽管大语言模型几乎掌握了人类社会的所有知识,包括开车的知识,但语言模型的知识压缩始终是稀疏的,相当于将感知传感器获得的海量信号变成文本Token,并进行过度压缩,实际上可能难以应对物理世界当中的稠密信号,比如,从路旁滚出来的一只足球意味着是不是还有人追出来,动物在路上行走是否要绕行等等。


简单来说,语言并不是实现驾驶任务或者移动任务的决定性因素,就如动物不需要掌握语言就可以灵活自如的行动,一个人不需要多少知识也可以掌握驾驶技能,因为其早已从生活经验中掌握了关于物理世界的行动规律。


但是掌握语言知识(看懂符号、理解语义)能够让一个人成为合格的司机,从而才能够胜任在现代交通环境下的“正确”驾驶。也就是说,语言模型不是自动驾驶系统的关键,但却是一个必不可少的辅助。


2026 年上半年,随着国内多家头部企业先后发布基于世界模型、VLA、强化学习等核心技术的物理 AI 方案,行业从 "端到端范式" 正式迈向 "物理AI范式" 的新阶段。我们可以看到各家的方案都在走向趋同,都在强调世界仿真模型和强化学习的作用,也都重视VLA在车端方案中的作用。


物理AI 被看做是自动驾驶最终实现的“最终解”。


轻舟智航面向自动驾驶领域推出的“世界模型+强化学习”物理AI统一架构,成为本轮技术变革的一个典型标杆样本。


02.

自动驾驶物理AI的“轻舟范本”


2026年4月的北京车展上,轻舟正式发布统一的通用物理AI架构,构建出云端+车端的统一技术底座,用统一的架构同时支撑乘用车L2+城市NOA和L4 自动驾驶两大产品线,去解决高低阶采用不同研发体系的行业痛点。


具体来讲,轻舟构建起“云端世界模型”和“车端世界行为模型”这两层架构,可以为乘用车、无人车等全场景提供统一AI基座。


Image


其中,“云端世界模型”搭载了世界仿真引擎与安全强化学习,具备高可控视频生成、零样本场景生成、低成本闭环仿真三大能力。通过基于运动模拟的交通流、障碍物难例、高危罕见场景生成以及恶劣天气零样本生成,云端世界模型可以低成本、高保真地生成海量“长尾场景”,让AI在数字世界中获得近乎无限的训练机会。


“车端世界行为模型”则同样采用“世界模型+强化学习”模型架构,以世界模型为主干,实现感知到决策全链路模型化,可以实时预测行人、非机动车、机动车未来动态,提前完成减速、避让、绕行操作,从被动避险升级为主动预判风险。


Image


2026年下半年,行业将开启物理AI的方案的量产上车进程。轻舟也计划实现基于超500TOPS算力的城市NOA方案量产上车。


这一方案采用 “世界模型 +强化学习” 的物理AI统一架构,大幅度提升复杂场景和罕见场景的处理能力。轻舟认为,世界模型一定能够上车,其关键就是模型的轻量化,创新之处就在于算法优化而非单纯硬件堆料。


最后我们回到智驾安全。这一问题始终是高悬自动驾驶行业的“达摩克利斯之剑”。


智驾安全的解法一直有两种思路,一种是增加感知冗余、算力冗余、规则冗余,但无形增加了系统成本和开发成本;另一种是通过算法创新、工程创新、架构创新,通过物理AI的新技术范式来构建更强大和聪明的“智驾AI大脑”。


根据轻智航CEO于骞的观点看来,人类开车时候有大量盲区,但依然能够安全的开车,就在于有一个强大的大脑。显然,通过世界模型等物理AI模型,是构建起更强的智驾安全的关键因素。


从技术层面来说,依托世界模型+安全强化学习,智驾系统可在虚拟空间遍历上万种极端危险场景,持续优化避险逻辑,能够掌握极端场景下的应对经验,从底层的算法层面,就保证了系统的安全性,从而让真正大规模的智驾安全兜底成为可能。


从商业层面来说,智驾安全的首要价值是降低行车过程中的事故损伤,其次的价值就是带给用户真金白银的收益,也就是智驾用户可以花费更低的保费来保障出行安全。于骞在2026年初就预判,成熟的高阶城市NOA车辆长期保费有望较普通车辆降低50%。


2026年下半年,我们将见证物理AI技术的加速落地。这一进程不仅会体现在各家主机厂新车型的参数当中,也会深入到每一次智驾功能开启后的丝滑体验中,更是会在未来体现到智驾安全提升带来的实际收益当中。


这是这一轮物理AI的技术变革,能带给智驾行业无比确定的稳定预期。

x

收藏 0
打赏
相关标签:
电话:010-65030507
邮箱:editor@autor.com.cn
地址:北京市朝阳区朝外大街乙6号朝外SOHO D座5097室
北京智驾时代传媒科技有限公司          Copyright © 2014 - 2022
Autor.com.cn All Rights Reserved. 版权所有 AutoR智驾 智能汽车网
京ICP备14027737号-1      京公网安备 11010502038466号
电信与信息服务业务经营许可证:京B-20211307
关注官方微信