今天小编分享的汽车经验:全国智驾对决:技术混战,看见L3雏形,欢迎阅读。
本文是 36 氪汽车对智能驾驶技术报道的第四篇。2023 年以来,高阶智驾领網域云波诡谲,技术与商业化同时爆发,行业在混乱中寻找方向。本系列文章主要关注智能驾驶铺向全国的进程,以及以及端到端、大模型等技术的落地。后续还将持续跟进大算力计算方案、世界模型等新技术给智能驾驶带来的突变。
往期内容:
文 | 李安琪
编辑 | 李勤
" 感觉几个月干了别人好几年的活。" 经历大半年高强度开发后,一位理想汽车智驾工程师语气中透露着疲惫。
急行军,是过去一年理想汽车智驾团队的真实写照。CEO 李想有时候会半夜测试智驾功能,然后在工作群里扔出问题,工程师们只能连夜解 Bug。一周七天、凌晨时段下班,是封闭式开发期间智驾工程师们的常态。
2023 年,华为、小鹏、理想等掀起了智驾开城大战。但头部玩家之间没有显示出断层式差距,所以在主动 " 卷 " 对手的同时,也不断被对手的进度所刺激。
烈火烹油下,今年智驾行业的竞争已经扩大到全国范围。
华为率先喊出了 " 智能驾驶全国道路都能开 ",目前已全量推送给智驾车型用户,蔚来汽车紧随其后,开启全網域全量智驾推送;小鹏与理想虽未明确透露时间,但全国能开的智驾功能已经在小规模内测。
而特斯拉 FSD(全自动驾驶軟體包)的入华,更让国内智驾赛道云波诡谲。同行如坐针毡,一些车企智驾团队已经在积极打听 FSD 的具体推送时间,试图抢先体验功能。
特斯拉在国内起步虽晚,但势能充沛。" 一旦进来,FSD 可能都没有全国道路开通的概念,而是哪里都能用。" 有行业人士猜测。
陷在价格战泥潭中的汽车产业,连领头羊特斯拉都不堪重负,开启了一轮又一轮裁员。智能驾驶似乎在技术高强度竞争中,成了那个为数不多的技术变量,它离成为行业风暴还有多远?
智驾全国都能开:热闹的、质疑的
今年 3 月 19 日,华为问界宣布高阶智驾全量推送给用户,称覆盖全国 99% 道路。
" 全国都能开 " 的智驾范围,也被华为具象化为 4 万个城镇与乡村。华为的目标是,到今年底搭载华为智驾系统的车辆将超过 50 万辆。
这为高阶智驾的破圈凿开了裂缝,也让同行倍感压力。如果智驾进度落后于华为,新势力们的品牌声量与销量可能会持续被华为压制。
对蔚来而言,今年没有新车发布,智驾成为了为数不多刺激销量的底牌。于是继华为之后,4 月 30 日蔚来汽车成为国内第二家,全網域全量推送高阶智驾功能的车企,用户覆盖超过 20 万。
小鹏汽车向来以智驾作为王牌筹码,阵地更不可丢。理想汽车也在朝 AI 科技公司转型,也势必要保持在智驾第一梯队。
据 36 氪汽车了解,跟激进的营销口号相比,车企智驾的实际推送要相对谨慎。
无论华为还是蔚来,都需要用户先通过考核和测试,同时在高速路段积累一定智驾里程后,才能在城区开启智驾功能。
事实上,有多位智驾从业者都向 36 氪表达了对 " 智驾全国都能开 " 的困惑与质疑。
首先,各家车企智驾对 " 全国都能开 " 的推送标准并不一致。比如华为的颗粒度很细,强调的是 "40000 个城镇 " 都能开;蔚来更强调用户能开启智驾的道路里程长度;小鹏则更多强调智驾的接管次数。
标准不一致,功能测试的强度也随之模糊。
在推送给用户之前,车企基本都会进行智驾功能测试与验证。" 但全国道路范围相当大,现阶段几乎不可能每一条路都测试完。而推送给用户之前,车企智驾做了多少测试,全凭良心。" 多位行业人士对 36 氪汽车如此说道。
当前高阶智驾还没有形成统一的产品可用标准,各家车企智驾只能比拼嗓门与营销力度。
同时,智驾在全国道路可开,并不意味着好用与功能完善。
有位智驾技术人士向 36 氪表示,在一些大型路口,智驾系统的感知能力还面临很大挑战。
比如拥堵情况、晴天雨天、白天夜晚等场景性变化,都可能导致无图智驾的功能一致性较差。比如车辆拥堵时,地面标线被遮挡严重,无图智驾可能就应付不了;等道路畅通的时候,车辆又能自己开启。
" 所以,评价智驾功能的好坏,要关注在不同场景条件下功能的一致性。" 上述技术人士说道。
也有智驾公司技术管理层向 36 氪给出参考,可以将智能驾驶产品分为可用,够用,好用三个等级。
可用,代表产品功能可用,比如智驾全国能开。够用,则是在用户高频使用的路段表现足够好,而不是开几公里就要接管。好用,则是让用户主动愿意开,只要上车都想开启智驾功能。
" 特斯拉实现了够用,摸到了好用的边界。但国内的头部玩家基本还处于可用到够用之间。全国都能开,都只是可用。" 上述行业技术人士如此评价道。
蔚来智驾负责人任少卿在接受 36 氪采访时也表示,智驾 " 全国都能开 " 整体需要两年多时间,第一年主要保证智驾功能可用,接下来还需要一年时间来持续优化功能体验。
可见,所谓的 " 智驾全国都能开 ",只是功能 " 可用 " 话题的终结,但也是产品体验打磨、漫长商业化较量的开始。这离不开端到端等新技术的持续落地。
端到端,是噱头还是良药?
在大洋彼岸,特斯拉 FSD v12 版本已经进化到了相当拟人的智能驾驶效果。该版本采用的端到端大模型,也被视为自动驾驶下一代方案。
传统的智驾系统分为感知、预测、规划和控制等多个独立模块,方案基本依赖于工程师们一行行代码制定的规则,来驯化自动驾驶车辆。
而端到端自动驾驶方案,则是把传感器数据作为输入,然后输出车辆控制指令。因为中间过程都靠 AI 神经网络模型来完成,信息传递不会减损。" 就像两个大腦神经元的连接一样。" 有行业人士比喻道。
换句话说,基于 AI 神经网络,智驾系统在海量数据的训练下,会自主学习、模仿人类的驾驶经验。
有行业人士对 36 氪汽车表示,基于端到端方案,智驾系统可以在复杂城市路口场景表现得更加拟人,过红绿灯可以更加丝滑。
不过,特斯拉至今没有公布过端到端具体技术实现,行业也很难判定其是否真正从 " 影像输入 " 到 " 控制输出 "、完全抛弃了传统模块的任何中间环节。
有行业技术高层告诉 36 氪,目前国内端到端方案基本不会采取特斯拉那么激进的方式,而是采取更柔和的方案。
事实上,2023 年初智驾行业集体抛弃高精地图后,头部公司的技术路线基本已经合流,形成了感知大模型的三件套:基于 Transformer 的 BEV(鸟瞰图)、Occupancy(占据网络)、道路拓扑关系网络。
沿着这条路,头部车企智驾团队也在筹备训练规划控制大模型,通过感知与规控大模型后续持续融合成一个神经网络,最终实现端到端。
以华为前段时间发布的乾崑 ADS 3.0 高阶智能驾驶为例,就在感知大模型基础上,提出了预测 - 决策 - 规划大模型。小鹏也表示,在感知大模型下游引入了基于神经网络的规划控制大模型 XPlanner。
不过国内的端到端方案,基本还是从感知,到预测决策,到规划阶段,智驾系统还不会完全直接输出控制指令。
同时,引入端到端也不意味着,要全部抛弃传统基于规则的方案。
有头部车企智驾人士告诉 36 氪,比如感知大模型中往往只检测出红绿灯的位置与颜色,但 " 如果遇到前后左右都有红绿灯的场景,还是要用到一些规则,告诉车辆当前车道应该遵循哪个红绿灯的信息。"
同时,在规划预测模块中,加入的 AI 神经网络也只是作为一部分参考,最后的方案仍然有规则来兜底。" 目前还是靠规则更多,系统会存在两种模式。"
此前,前小鹏汽车智驾负责人,现英伟达汽车事业部负责人吴新宙在小范围的媒体沟通会上也表示,端到端是自动驾驶的最终一步。
但他也表示:" 不要从字面理解(端到端)就是从像素到动作,可能会有一些别的东西配合。端到端的模型上线之前一定会有‘护栏’,因为需要不停地优化和成长,要是一开始就上线端到端的模型是非常困难的。"
换句话说,传统方案与端到端思路的结合,会是行业更主流的方案,而国内智驾玩家可能还需要用 1-2 年时间来持续验证。
迈过城区智驾,迎接局部 L3
但特斯拉 FSD v12 的惊艳效果,并不只依赖端到端方案,更依赖百万量级的车辆数据,以及超 10 Eflops 的训练算力。这是特斯拉 FSD 甩开同行,在北美地区更快开启商业化篇章的原因。
马斯克此前在社交平台上称,今年特斯拉将投资约 100 亿美元,用于 AI 的训练和推理,AI 推理部分主要用于汽车。" 任何公司如果不能达到这一水平的支出,且不能高效地进行支出,就无法竞争。"
而想要追上特斯拉的步伐,车企智驾团队除了采用端到端方案之外,还需要在数据与算力方面实打实投入。
但海量数据的积累,基本只能依赖车企们的高阶智驾硬體车型。车企需要卖出更多的车,才能积累更广泛地網域的量产数据。
从云端算力来看,目前华为是国内智驾算力最大的玩家。华为表示,6 月智驾 ADS 训练算力将达 3.5EFLOPS。小鹏、蔚来、理想的智驾算力中心算力分别是 0.6EFLOPS、1.4 EFLOPS、1.4 EFLOPS。
至于车端算力,从行业人士的反馈来看,目前英伟达的 Orin 芯片已经可以支持端到端方案运行。
不过英伟达的下一代智驾芯片平台 Thor 也已经在路上,这将是智驾领網域的新变量。据英伟达官方,Thor 的 AI 算力达 1000 Tops,专门针对 Transformer、大语言模型(LLM)和生成式 AI 等技术框架而设计。
有行业人士表示,Thor 落地后,未来可以进一步支持大模型在车端本地化部署、多模态大模型落地等。" 车辆可以成为可以自主进化的机器人。"
目前,比亚迪、蔚来、小鹏和理想、广汽等车企都将采用英伟达的 Thor 芯片,该芯片将于 2025 年量产。
而迈过城区智驾的分水岭,智能驾驶行业有望来到 L3 级自动驾驶领網域。
此前蔚来智驾负责人任少卿告诉 36 氪,在 L3 以下,车主是智驾系统的主要责任人,但进入 L3 以后,车企需要厘清人机共驾的边界,智驾功能的保险逻辑和商业逻辑也需要发生变化。
这不仅仅是技术与工程的挑战,更是保险和政策等全方位商业形态的变化,这会是一场更加漫长的商业战争。任少卿也认为,在大规模 L3 到来前,行业会率先进入局部 L3,进行方向性探索。
而 L3 阶段的较量,也从此刻的全国全量智驾开始,埋下胜负的种子。