今天小编分享的汽车经验:端到端,是自动驾驶的终局方案吗?,欢迎阅读。
2024 年,中国新能源汽车行业的发展核心就是一个字——卷。卷价格、卷配置、卷到无以复加,甚至连开始全量推送的智能驾驶,也开始了 " 卷 " 技术。
从去年火热的 BEV/Occupancy Network,到今年更加火热的端到端。智驾卷技术从没有像这两年这么猛烈,就像是技术明牌后,所有车企及供应商都在明牌冲刺。
最近智驾圈发生了两件值得说道的大事。
一是小鹏汽车董事长何小鹏,发文高度评价特斯拉自动驾驶 " 表现极好 "。
何小鹏表示:" 这两天我在美国加州体验了 FSD V12.3.6 的版本,也打了一台 Waymo 体验。总的来说,在旧金山城区 Waymo 表现更好,而 FSD 在硅谷和高速表现极好,可以达到很高的分数,很多路况处理都很丝滑。我非常感慨 FSD 在数月里有很大的进步,我们也会向 FSD 学习他们优秀的功能点和用户体验部分,我相信 2025 会是完全自动驾驶的 ChatGPT 时刻!在自动驾驶这个行业,大家都在互相快速学习,自我迭代,一起提高大家出行的幸福感。"
二是蔚小理三家不约而同完成了智驾团队的组织调整。
蔚来单独设立了一个大模型部,专门负责端到端的模型研发。
理想则在 5 月裁员中,保留了算法研发团队:由贾鹏管理,主要负责无图城市 NOA 的研发、落地,以及端到端智驾的预研。
而在小鹏智驾团队中,直接与数据相关的部门至少有 3 个,包括大数据、时空数据、美国平台支撑数据等,分工很精细。
据有关报告,大部分 All in 端到端的公司都在削减原有团队规模,将团队重心调整到 AI 大模型和数据基建方向。
一切瞄准端到端,一切服务于端到端,已经成为行业的共识。
简单看一下头部车企的端到端落地时间。
小鹏汽车是国内首个发布量产上车的端到端模型的整车企业。何小鹏今年 5 月表示,到 2024 年第三季度,小鹏汽车的目标是 " 全国都能开,每条路都能开 ",2025 年实现城区智驾比肩高速的智驾体验。
4 月 24 日,华为智能汽车解决方案发布会上,华为发布了 ADS 3.0 端到端架构,并将于 8 月随着享界 S9 正式上市。
理想汽车这边,7 月 5 日将召开智驾发布会,预计也将公布自己的端到端上车规划。而蔚来自动驾驶副总裁任少卿在接受采访时则表示,蔚来已经在布局端到端,预计今年将实现上车量产。
事实上,虽然多数团队已经调整完毕,并且给出了端到端量产时间,但参考特斯拉从 FSDv11 到 v12 经历的 " 性能爬坡 ",端到端模型上车后,其早期性能可能不会强于极致优化的经典技术方案,这也对管理层进行技术路线转型的决心提出考验。
同时,削减团队规模不意味着总体投入的减少,一方面,端到端转型会使现有智驾团队的人员规模减少,另一方面,端到端对数据、数据基础设施的投入增加。
对部分公司管理层来说,扩张团队的决策是容易的,但对数据、工具链等 " 看不见、摸不着 " 的资源投入更需要认知模式的切换。
围绕端到端自动驾驶的很多争议都来自于对其概念定义的不清晰,行业中看待这一技术的观点呈现出两极分化:
" 技术原教旨主义者 " 会认为,市场上很多公司所宣传的宣传 " 端到端 " 并不是真正的端到端;
" 实用主义者 " 则会认为只要基本原理符合,并且产品性能提升,端到端的准确内涵并不重要。
目前,自动驾驶架构的演进可以分为四个主要阶段:
第一阶段:感知 " 端到端 ";第二阶段:决策规划模型化;第三阶段:模块化端到端;第四阶段:One Model/ 单一模型端到端。
One Model 端到端自动驾驶可以看做是端到端的终局解决方案。这个概念被提出的时间比模块化端到端更早。
在自动驾驶产业刚刚开始起步的 2016 年,英伟达就提出采用单个神经网络(卷积 + 全连的简单架构)来实现端到端的自动驾驶,输入和输出就是最原始的传感器信号、方向盘角度及油门开度。
随着 Transformer 网络架构和车端算力(逐步可支持 0.1B~1B 级参数量网络运行)的提升,One Model 的端到端方案又重新回到人们的视野中,甚至会演化成为端到端的终局解决方案。
基于这样的判断,还有一个概念需要重点厘清。端到端与大模型这两个概念经常被混淆在一起。
但实际上,两者并不必然相关。大模型更多关注模型的参数数量以及涌现能力,而端到端更多强调的是结构上的梯度可传导以及全局优化。
目前的大模型为端到端实现提供了很好的可选方案,但是端到端并非必然基于大模型实现。
从目标上来讲,大模型则像是一个多面手,它们拥有大量的参数,能够处理包括自动驾驶在内的多种复杂任务,如自然语言处理、影像识别等。
大模型训练所需的数据类型结构更广,而且由于其广泛的应用范围,对于可解释性以及可靠性的要求并不高。
相比之下,端到端的最终目的是让车辆能够自主导航并安全行驶。它需要学习和适应各种驾驶场景,以便做出准确的驾驶决策,更多基于标注数据进行训练,对于系统的可靠性要求更高。
而在世界模型与端到端自动驾驶的关系上,基本存在以下两种不同的观点:
第一,世界模型在整个自动驾驶算法的开发体系中以数据生成器的角色存在。第二,只要对世界模型进行微小的调整或者增加一些输出链路及模块,就可以实现 One Model 端到端自动驾驶。两种观点都有待未来的发展印证。
回到火热的特斯拉端到端方案上。
Tesla 宣称从 FSD12.3 版本开始采用端到端自动驾驶方案。业内普遍认为这些表现的巨大提升很大程度地建立在决策规划模块化基础方案之上,但是目前尚无法具体判断出 Tesla 的实现方案处于本报告定义的 " 决策规划模型化 "" 模块化端到端 " 或者 "One Model 端到端 " 中的哪一个阶段。
对于华为、小鹏等国内玩家而言,大家普遍尚处于感知 " 端到端 "、决策规划模型化阶段。
参考特斯拉在 2021 和 2022 年年底的 AI Day 上分别公布了 BEV 和 Occupancy Network 的技术架构,而国内车企开始 OTA 基于 BEV/Occupancy Network 的功能普遍在 2023-2024 年,国内与特斯拉的研发进度差大概在 1.5~2 年。
2025 年,将是国内车企全面量产端到端方案的元年,或许也是特斯拉 FSD 正式入华的时间点。
而 One Model 端到端系统预期其落地时间会晚于模块化端到端 1~2 年时间,从 2026 年至 2027 年开始上车量产。
尽管端到端技术如此之火,但是我们仍不能笃定其就是自动驾驶的最终解决方案。
乐观来讲,从人工智能的特性、发展速度等交付分析,人工智能的涌现能力,或许昭示着端到端只是未来众多技术方案之一。
但不可否认的是,无论是学术界、产业界在端到端自动驾驶领網域的快速进展,还是资本市场对相关公司的关注,都指向一个趋势:端到端开启了新一轮的自动驾驶产业革命。