今天小编分享的汽车经验:“端到端”不绝对=绝对不“端到端”?,欢迎阅读。
这个夏天,温度着实有些高。而对于汽车行业来说,智驾的热度也同样居高不下。
短短一个月的时间,新势力中的 " 御三家 ",理想、蔚来、小鹏像是约定好了一样,先后举办智驾 Tech Day。
7 月 4 日,理想汽车举办了智能驾驶夏季发布会,宣布 " 端到端 + 视觉语言模型 " 的早鸟计划正式启动,24 年底或 25 年初进行实车推送。
7 月 27 日,在蔚来创新科技日上,他们正式发布了智能驾驶世界模型 NWM(NIO World Model),即全量理解信息、生成新的场景、预测未来可能发生的多元自回归生成模型。
7 月 30 日,小鹏汽车在 AI 智驾技术发布会上宣布推送 XOS 5.2.0 版本,号称 XNGP 从 " 全国都能开 " 更新为 " 全国都好用 ",实现 " 不限城市、不限路线、不限路况 " 的全国全量开放,且打通 ETC 收费站场景,预计 2024 年内实现真正的 " 门到门 "AI 智驾体验。
真的,就仿佛约好了一般," 御三家 " 集中在 7 月开智驾 Party,而且,技术路线再度趋同。我们不禁要喊出那句话了," 或许,智能驾驶真的没有代差 "。
而在这个浪涛滚滚的时代里,大家都被推着向前走。技术高地固然要冲锋,但满眼浮躁的、萝卜快了不洗泥的风气,也从未消散,包括人员流动,以及路线摇摆。
事的背后一定是人,那我们就从 " 人 " 讲起。
自去年 8 月,小鹏汽车智驾灵魂人物吴新宙离职之后,小鹏智驾的变动就没有停止过,但基本也都停留在大佬级的 " 活水流动 "。
从最新消息可知,小鹏汽车又进行了一轮内部调整,而这次调整的重心是技术开发部。
在小鹏汽车的架构规划里,技术开发部是算法研发部门,具体涵盖了感知、规划、控制、定位的算法研发。经调整之后,原技术开发部被拆成了三个细分部门,分别是 AI 端到端、AI 应用、AI 能效。
从部门名字就可以推知,"AI 端到端部门 " 负责端到端模型的研发,"AI 应用部门 " 负责交付。也就是说,这次调整相当于将算法团队分而治之,一部分去做模型,一部分去做交付。
很显然,在端到端的巨大浪潮下,小鹏汽车的人力资源配置,正跟着端到端量产落地的计划进行相应的调整。
无独有偶,蔚来,理想也做出了类似的选择。
近期,理想汽车成立了 " 端到端自动驾驶 " 的实体组织,整体 200 人出头。而理想智能驾驶整个团队主要分为算法研发、量产研发两个大组,团队约 800 人。
具体来说," 端到端 " 的研发主力就部署在算法研发组了。而说到算法研发的主要工作内容,包括了感知算法、行为智能、认知智能,相应的,量产研发则包括智能行车、智能泊车、智能安全等。
此前,蔚来也将感知和规控团队合并为了大模型团队。在业务调整后,蔚来智能驾驶研发副总裁任少卿明确表示,要放弃业界沿用多年的 " 感知 - 决策 - 规控 " 传统范式做智能驾驶,未来将逐步转向为端到端大模型范式,用深度神经网络技术实现高阶智驾。
从各家空前一致的选择来看," 端到端 " 自动驾驶确已成为各大主机厂必争的技术高地。
人员调动,服从着技术路线的调整。悄然间,几乎所有的筹码都砸向了 " 端到端 ",可以说,诸君下足了血本。而未来几年的技术目标,在其明晃晃的腦门上,也全部写着 " 端到端 "。
那么,我们不禁要刨根问底地寻找答案了,这引得无数车企 " 竞折腰 " 的端到端究竟是什么?
就像网络上应接不暇的网络热梗,这几年智驾圈的技术名词也越来越多,诸如:BEV+Transformer、端到端、世界模型、多模态等等。
它们不像机械范畴的内容,就算你没搞懂某个机械的内部构造,但多多少少能联想到是汽车的哪一个部分,大概会起到什么作用。但智驾的技术名词几乎是一种黑洞里的虚无了,非专业深耕者,未必能窥探其奥秘。
所以,普罗大众对这些名词还非常陌生。问,就是端到端,听上去很厉害。那么,端到端是什么?不清楚!
今天,我们再做一次浅浅的科普。
对于端到端来说,其早期核心定义是 " 从传感器输入到控制输出的单一神经网络模型 "。 近年来,端到端的含义有了更深层次的延展,可以视为感知信息无损传递,也可以实现自动驾驶系统的全局优化。
实际上,自动驾驶架构衍生于机器人架构,通常包括:感知(Perception)、决策(Decision-making)、控制 ( Control ) 三大模块。
感知:自动驾驶的感知系统从多传感器、如摄像头、激光雷达、毫米波雷达等获取信息,形成对周围信息的理解。
决策:基于感知信息和预先设定的规则,形成车辆行动策略,将涉及路径规划、速度控制、车道保持、转向等行为。
控制:负责实现决策中的行动,使车辆安全稳定地按照规划的路径和速度行驶。
前期,大家宣传的端到端更多指的是 " 感知端到端 ",包括了 BEV+Transformer 的组合。
具体来说,Transformer 舍弃了传统循环处理机制,引入 "Attention" 机制来处理序列数据,能够理解复杂的数据关系。
随着技术发展,决策、规划功能模块也被集成到另一张神经网络当中,形成感知输出到轨迹输出,两者之间的通信接口是人为定义的感知类型,比如说两轮车、红绿灯、锥桶等,但整个架构还是由数据驱动,这就是目前很多厂家所采用的两段式 " 端到端 "。
然而,只要是人为定义,还是会出现信息损失,所以说,未来的端到端发展追求 One Model,其性能上限也会更高。
从这一点看,当前大家宣传的 " 端到端 ",并没有达到 One Model 的程度,那么,在体验上,也要打一个问号的。
近日,同济大学的朱西产教授就有过这么一段发言:" 特斯拉的端到端、人工智能让自动驾驶更加成为可能,端到端被特斯拉带火了,国内的车企都在说端到端,但现在,谁宣布端到端(量产上车)了,他的这个车你就别买。"
这个判断,听上去有些绝对,但我们细究一下背后的逻辑,其实有很多启发意义。
首先," 端到端 " 确实是特斯拉带火的。在今年 3 月推出了 V12 版本的 FSD 后,特斯拉宣布他们已经删除了几十万行的人工规则代码,实现了预想中的 " 端到端 "。
据了解,特斯拉的端到端,已经做到了 One Model,消除了感知和定位、决策和规划、控制和执行之间的断面,将三大模块组合在一起,形成了一个庞大的神经网络。
特斯拉的核心优势,并非算法本身,而是数据和算力。车卖得早,也卖得多,他们早在北美做到了数据闭环,那就可以用来训练整个系统;同时,AI 训练算力也有优势,至少,它不会被无端制裁。
消除断面,抛掉准则模型,形成 One Model,智驾系统的上限会很高,当然,下限也会 " 摸不准 ",因为对于一些特殊路况,已经无法判断它有没有学会了。
这种 " 盲盒感 ",让端到端存在巨大的体验落差。如果你的 " 端到端 " 没做好,其实还没有之前的规则算法体验好。
而在优化的路径上很难 " 抄近路 ",你就是需要大量数据、大量 AI 算力。那么,该怎么办?长远看,就是卖出更多的车,以及储备更多的 AI 算力。
而当前能做的,其实是 " 不冒进 "。如果一步跨不到 One Model,那就保留必要的冗余,比如融合激光雷达的感知,安全准则模型也不要轻易丢。
" 分段式 " 的端到端不丢脸,但体验还是要细打磨的,不然,某个版本更新后比之前的差,才是真的把用户当小白鼠了。
如果说汽车的上半场是电动化,那么,如今超过 50% 的新能源渗透率,已经完成了车市大洗牌。
而被誉为下半场的 " 智能化 ",则成为了所有品牌不愿错过的 " 黄金圣杯 "。智驾是天梯,更是尖峰,技术更迭、架构调整、抢夺人才,每一个现象都是当下的常态。终究,赛道上的人都在赌一个明天。