群发资讯网

端到端自动驾驶成包包的思考自动驾驶 2025 年这个节点再提到端到端,似乎没什么

端到端自动驾驶成包包的思考自动驾驶 2025 年这个节点再提到端到端,似乎没什么热度了,因为这已经成为了自动驾驶行业的一个非常明确的发展路线,现在大家都在提VLA,WM这些基于端到端范式基石之上的增强模型组件。但在2025年底还是想重提下端到端,因为他对自动驾驶行业确乎是里程碑意义的。用稍微时髦点的话来说端到端是自动驾驶行业的范式革命。为什么这么说呢?在端到端范式跑通之前,业界主流的自动驾驶系统本质上是一个模块化、规则驱动的软件工程系统,模块化指的将驾驶拆解为感知、决策、规划、控制等独立模块,规则驱动指的是每个模块塞满“if-then-else”。活脱脱的一个规则执行器,它的基本工作原理是拿路上遇到的实际情况与人工提前写好的规则去比对,匹配上就按规则执行,匹配不上的话系统就提示接管自动退出。比如说系统想要自动变道,会感知目标车道后侧车辆距离和速度,如果满足条件就发起变道,不满足就继续等待机会。原理和机制非常好理解,好像自动驾驶也没啥难度啊?但是我们要知道现实世界的驾驶场景是无限且长尾的,面对各种 Hard Case 、Corner Case(可能是空中飘过的一片落叶,可能是一个修路的临时改道,也可能是一个常人都不太好判断的多岔路口),如果每解决这样一个场景,都要靠工程师们去打规则补丁,补漏洞,系统将越补越复杂,驾驶行为也会越来越僵化,变得臃肿且脆弱。这种“规则驱动”的模式看上去门槛不高,但天花板确实特别低。所以地平线的苏箐曾这样说过:「不想再干自动驾驶,第一因为干自动驾驶太痛苦,第二看不到太多希望」太痛苦就是指 自动驾驶使车辆在稠密的现实环境中运行,必须处理所有可能出现的场景(Hard Case 和 Corner Case),没有任何逃避的空间。看不到希望是指 规则驱动的技术路线,天花板太低。本质上这是人与机器思维和行为逻辑的区别决定的,人类开车考的是“经验、直觉、临场判断”,机器则是依赖“规则、逻辑、高精地图”。端到端之所以被称为自动驾驶的范式革命,是底层逻辑的根本转变。它不再试图教会汽车“思考”,而是让它直接“感觉”,就像我们人类驾驶员那样。从规则驱动走向数据驱动。端到端系统抛弃了规则匹配的方法来确定如何决策。我们不再需要人工写好一条条的情况去比对,而是让系统真正自己去学习判断如何处理。那它到底如何实现的呢?其实就是运用了大模型技术,让系统自己去找规律,从海量的人类驾驶视频当中去找规律。依靠摄像头收集到的海量数据,去学习人在面对各种路况时候的行为和决策,找到其中的规律并以此来决策。看到这里大家应该明白革命性的不是指某项功能的突破,而是底层哲学的颠覆:自动驾驶要的不是更强大的计算机功能,而是更接近人类驾驶行为的“直觉”。当然,端到端系统也并非是一蹴而就的,从当前行业技术发展来看,会分阶段来实现。一个部分是感知层面的端到端,另一个是决策层面的端到端。感知的端到端,就是输入数据后系统自动学习物体规律,识别并标记,后续的决策依然采用人工规则。决策端到端,就是感知部分还是按照之前的学习办法去处理,只是应对各种条件决策的时候,才去找规律。逻辑上来说这两部分应该是可以独立开的,所以目前国内车企上线的端到端系统,有可能只包含了其中的一部分。特斯拉FSD V12版本在感知层面和决策层面都统一了端到端系统,没有了人工规则来判断是什么,也没有人工规则来判断应该怎么做。全部都是系统通过自动学习数据找到规律后自行处理。这也是为什么马斯克会说新系统的代码数量大幅减少,因为不再需要人去一条一条的假设场景,写出规则引导系统决策。端到端系统最大的问题在于模型能力起步比较慢,但是天花板却远高于上一代的规则驱动模式,伴随着足够的数据和算力的提升,一旦过了临界点,大模型质量的进一步提升,其驾驶体验将远超基于规则的技术范式.最后 还是奉上苏箐演讲的这一张图:过去规则驱动的范式是在打补丁,堆功能的拼积木式的乐高玩法。现在数据驱动的端到端范式是以数据为引,算法模型为翼的自然生长法则,从一颗种子成长为一棵参天大树。